admin 管理员组文章数量: 1184232
2024年4月19日发(作者:vlookup两表找出相同数)
维普资讯
2007年第1期 福建 电脑 79
浅谈XML与HTML的异同
刘珍.李运楼
(江西工业贸易职业技术学院江西南昌330100)
【摘 要】:本文主要围绕HTML和XML两种标记语言,通过比较,指出了它们之问的相同和不同之处。虽然均为标记
语言,HTML主要长于显示数据项,便于数据信息在Wcb上的显示;而XML更方便数据信息的存取、处理、交换、转换,适宜
不同系统和应用程序之问进行数据交流和整合。
【关键词】:HTML、XML、相同、不同
HTML是”超文本标记语言”的英文首字母缩写词。是~种
用来制作超文本文档的简单标记语言.其英文全称为HyperText
Mark—uD Language。HTML是SGML的一个子集。而SGML(即
Standard for General Markup Language,通用标记语言)是一种庞
大的规范 是由WWW协会(W3C:Word Wild Web Consortium)
于1986年开发的。用HTML编写的超文本文档称为HTML文
档.它能独立于各种操作系统平台(如UNIX,WINDOWS等)。自
1990年以来HTML就一直被用作Wodd Wide Web的信息表示
语言.用于描述Homepage的格式设计和它与WWW上其它
Homepage的连结信息。使用HTML语言描述的文件,需要通过
WWW浏览器显示出效果
XML.是”可扩展标记语言”的英文缩写词,其英文全称为
eXtensible Markup aLnguage。1996年W3C又将SGML的格式精
简后制定、开发出另一种标记语言XML。XML是一套原则,可以
让各行各业自行定义出如HTML般的标注语言.方便资料存取、
处理、交换、转换等。XML在使用上比SGML简单,结构上比
HTML更加严格。XML技术自出现以来,发展非常迅速,在许多
领域内得到广泛的支持而且有着广阔的应用前景。例如电子数
据交换、电子商务等等更是把XML作为一种基础性、支柱性的
技术来看待
与HTML相J司的是:
XML也是一种标记语言,同时也是SGML的一个子集,建
立在放在尖括号中的标记的基础之上。和HTML一样都以一对
相互匹配的起始和结束标记符来标记信息。作为文本,它们的数
据具有高度的可移植性和广泛的可部署性。二者文档可以在任
意标准文本编辑器中创建和编辑。作为普通文本,它们都避开了
许多与平台相关的问题.非常适合于在Intemet上传输。
但XML与HTML也存在许多的不同:
第一、HTML的标记集固定。不能人为扩展。XML的标记集
并不是固定的.它是一种元语言,允许人为创建其他标记语言或
者使用他人已经创建的标记语言。正是这种定义新标记的能力,
使XML成为一种真正的可扩展语言。
第二、HTML主要用于显示,即数据只是显示项,对数据只
提供了一个”视图”.如果你想要得到不同的视图的话,必须重新
生成一个HTiVlL网页 XML主要考虑的是数据及其结构,没有
假定标记如何在显示设备上显示.仅提供了一种方式,使用我们
自己
11-TlvIL示斜 XML 钠
HTML .e?X.MLVE船10HI¨I,0 S ND^Lom ”
稍l ID-"MN n棚 <ffr'AT ̄STATEID= MN
Mi2 n 12‘ Ci竹 }I》 CnYcrrYiD= l2’
ot) 州^h噼】ohn,oB叫确皿p
・
‘ T, 蝴_0PU d∞N"OO0计0HJL^ 0N)
<DD ohm口 D < ̄CITY>
<DT'-,popuhttionc4DT ̄ cI1YC丌YID-‘l5 )
5o0O n ^ME Hr_vilI酬^M色>
∞L 日,oH几 兀0N O帅O 0PUI I10N
ID-"1S':,Civ/</Kt ̄ CrTY
∞L K
qmH¨ D呵
DD)Fi ̄ville<tDD
PD砌州枷 ,D呵
(DD ∞O咖D'
∞b
HT
从表中我们可看到:HTML标记仅向浏览器描述了该文档
中数据显示的格式.并没有明确指出数据组成及各数据所代表
的含义:而XML文档中并不包含浏览器显示格式。它只包含标
记和数据。并未明确告知浏览器何时换行,何时字体加粗。但
XML分层展示了数据组成以及它所代表的意义。
第三、许多HTML标记都只取首字母的缩写词,因此它们不
如普通语言那么易读。XML标记名便于阅读,且表达了数据的
含义。每个XML标记就位于相关联数据的前面,这样人和计算
机都可以容易地识别信息结构。
第四、在HTML中,数据及其表示逻辑是交叉存取的。
HTML标记没有给数据的内容添加任何语意含义,仅描述了表
示信息。这种方式很难以只维护数据或只维护数据的表示方式。
层叠样式表(CSS)虽然对把数据与其表示格式分隔开来起到了
一
定的作用.但许多Weh页面仍在表示标记中存储了数据。标
记和数据结合在一起.很难进行分割。因此它不允许用户对数据
进行变换以便进一步进行处理。而XML主要考虑的是数据及其
结构.在其语法规则上要严格得多,或有”良好的格式”,这要求
所有的标记都有对应的结束标记.不能重叠。从本质上看,使用
相同的XML数据文档在不同的设备上显示的结果不同。这种数
据.q-表示的分离也极大地方便了数据的访问:另外数据结构遵
循显而易见且有用的模式.使得处理和交换数据更容易。
第五、HTML中数据不能指定层次,而XML中数据成树形
等级结构。文档至少包括一个根元素或文档元素,所有的下级元
素都包含在根元素中 元素之间不能交叉。
第六、使用HTML搜索如”Tom WolP’编写的书籍时,有可能
会返回作者上下文之外的术语”wolft。而使用XML可将搜索范
围限制在适当的上下文(如包含在<author>标记中的信息)之
内.从而只返回想要的信息类型。使用XML、Web代理程序和智
能程序(用来使Web搜索或其他任务自动化的程序)将更加有
教并且产生更有用的结果。
第七 HTML的格式既不适合机器分析也不适合人阅读它
的源码.而且格式要求比较松散:HTML解释器采用的是尽量解
释的机制 这样造成的一个弊病是同一个页面在不同的浏览器
中可能显示的结果大不相同。而对于XML,我们可以为不同的
浏览器用不同的样式表转换不同的HTML文档。
第八、XML的应用并不局限于Web。XML在体系结构上是
中立的.可以很容易合并到任何应用程序设计中。
在应用程序开发过程中经常遇到一些与数据相关的问题:
如何整合数据和自己已有的业务系统以及商业伙伴的业务系
统7应用XML为该问题的解决提供了方案:
(1)异构应用程序的集成。公司之问要共享数据,那么这
数据就必须适用于不同操作系统平台的应用程序。XML数据恰
好符合要求。
(2)数据格式的转换。应用程序使用的数据类型没有统一。
通过使用XML这种适用于所有应用程序的标准数据结构,就可
以解决这些数据生成的问题。
(3)数据的搜索与查询。当数据的来源各不(下转第54页)
维普资讯
福建 电脑 2007年第1期
伸定义
(5)DNS—ALG检测到这个DNS报文是来自IPv6网络的,
1)定义了一个新的资源记录类型(AAAA或A6)将域名和
于是和NAT通信.NAT从地址池中为该IPv6地址IPv61分配
IPv6地址作映射:
一
个全球唯一的IPv4地址(设为IPv41)映射给主机Host1的
,
2)为反向域名解析定义了一种新的域;
IPv6地址IPv61,建立地址映射关系,并修改DNS报文回答区的
3)为了能同时处理IPv4和IPv6地址。对现存的附加信息
目的地址为IPv41。
区中的查询作了相应的处理
(6)DNS-ALG再把域名host1.net的类型type从从AA修
3.2 DNS—AI ;
改为A.然后回复给IP、,4 DNS。IP、,4 DNS再把这个DNS应答报
应用级网关ALG是一种允许纯IPv4节点和纯IPv6节点
文返回给主机Host3。
之间通信的特殊的应用代理。由于一砦应用级的通信在报文的
(7)至此。DNS-ALG的工作结束,此后的通信过程则是主机
负载里携带了网络地址.而NAT一 翻译机制本身对在负载中
Host3发送源地址=主机Host3的IPv4地址(设为IPv43),目的
携带了II)地址的应用无能为力,也不会去检测负载的内容,所
地址=IPv41(I ̄41为与主机Hostl的IP、,6地址IP、r61映射的
以将ALG与NAT-PT结合起来使用,才能对应用层的多种通 IPv4地址)的IPv4报文给目的地,即主机H0st1。
信提供有效的支持。
(8)IP、,4报文被路由到NAT-Pr,NAT查找到映射关系表
DNS-ALG在应用层对DNS报文进行了相应的处理.使得
后.把报文中的目的地址由IPv41替换为主机Host1的IPv6地
报文可以正确反映IPv6站点或者IPv4站点的域名和地址信
址IPv61。然后为源地址IPv43(主机I-Iost3的IPv4地址)加上前
息。DNS采用的协议基本上可以视为由客户向服务器发送查询
缀preifx,源地址成为了pref ̄::IP、,43.之后再对报文进行 的
报文。服务器回送应答报文。为节约分组内的空间,通常会对域
工作.生成目的地址=IIN61。源地址=preifx::IPv43的IPv6报
名采用压缩方法。大多数DNS服务器既支持UDP也支持TCP。
文。
通常应答报文采用和查询报文相同的传输服务协议。只做一个
(9)完成NAT和 的过程后,翻译网关将IPy6报文发
查询的客户大多使用非连接型的UDP。 出,最终由域名为host1.net的目的主机Ho8t1收到。
3.3、D
同理.由IPv6网络发起的域名访问II)v4网络的过程与此
类似,但在执行过程中有所不同。主要区别存在于DNS查询的
过程中。IPv6网络中的主机发出的DNS查询转交到DNS—AI_B
后.DNS-ALG通过访问IPv4 DNS得到要访问的IPv4网络中主
机的IPv4地址(设为IPv42),然后为其加上前缀px ̄fix,把pre-
fⅨ::IPv42作为DNS回答报文的目的地址返回给通信的发起
DNS—ALG翻译网关工作模型
方,即IPv6网络中的主机。在正式开始通信后IP、,6网络中的主
下面以IP、,4网络中的主机Ho8t3通过域名访问IPv6网络
机发送源地址=IPv6网络中发起访问的主机的地址(设为
中的主机Host1为例来描述DNS—ALC翻译网关的工作过程:
IPv61),目的地址=preifx::IPv42的IPv6报文,到达NAT后.再
(1)假设IPv4网络中域名为h0st3.net的主机,Host3希望
为IPv6地址IPv61分配一个全球唯一的IPv4地址(设为
与IPv6网 ,域名为host1.net的主机Host1建立连接。为了首先 IPv41),并将prefⅨ::IP、,42取后缀IPv42为目的地址,生成一个
穿越IPV4网络.主机Host3要先获取主机Hostl用于在IPv4网 源地址=IPv41.目的地址=IPv42的IPv4报文交给IPv4网络中
络中传送所对应的IPv4地址。因此。主机Host3向IPv4网络的 的主机.至此通信完成
DNS服务器发送一个DNS请求查询域名host1.net对应的IP、,4
4.结束语
地址,但此时DNS请求中域名host1.net的类型type为A(A是
由于IP、,6与IPv4在DNS记录格式上的差异.无法在IPv6
IPv4 DNS系统定义的一种资源记录格式)。 网络与IPv4网络之间直接实现DNS查询和响应。本文研究了如
(2)IPv4 DNS收到DNS请求后检查自己的记录,但由于事 何利用DNS—AIJG应用网关和NAT一 翻译机制构建翻译网
实上主机Ho8t1在IPv6网络中.因此主机Hostl的域名host1. 关.并描述了DNS—ALG翻译网关在 6网络与IPv4网络之间
net的DNS资源记录类型type应为A从A(AAAA是IP、r6 DNS
通过域名进行访问的工作过程。
系统新定义的一种资源记录格式),查找失败。随后IP、,4 DNS将
此DNS请求转交出去
参考文献:
(3)DNS_ALG拦截到该DNS请求,发现该DNS报文是一
1.G.TSirtSis.P.Smuresh.R_FC2766.Network Address Tran ̄tion—pro-
个从IPv4网络发来的请求。于是将资源记录。即域名host1.net
tO ̄O1 Tran ̄tion(NAT一 .February 2o0o
的类型type值从A修改为A从A然后转发到IP、,6 DNS。
2.P.Srisuresh,G.1 血is,P.AkldraiU.II.FC2694.DNS extensior ̄to NCt-
(4)IPv6 DNS收到这个DNS请求后查找自己的记录,得到
WOrk Addre ̄Tramlaton(DNS,^IG)September 1999
域名host1.net对应的IP、,6地址(设为IP、,61)。于是将这个地址
3.R.Gilligan.E.Nordm ̄k.R C2893
 ̄rrami6on Mcchanisms for IP
填入到DNS应答报文回答区的目的地址中.此时DNS报文的
Hos包and t1.oute ̄.August 2oo0
type依然填AAAA,并回复给DNS—ALG。
4.S.ThOll ̄Or1.C.Huitcma.RFC1886.DNS Exccf1sions to support IP
version 6
(上接第79页)
相同.格式多种多样时,要找到一个应用程序所需要的数据项就
文。处理结束后,同样还需要一个结构来进行显示。这些都需要
会变得非常困难。需将数据转换成XML.浏览其结构或数据容
用到结构化的XML文档。
器(在数据存储没有结构的情况下);找到想要的数据后再对它
进行操作。还可以把不同来源的数据归纳合并成单一的、一致的
参考文献:
格式。在此格式下。你可以对数据进行处理、编辑和操作,以解决
1.(XML.NET蝙程指南>电子工业出版社【蔓lAdam Sills.Mesbah
具体的问题。此外,利用XML还可以过滤数据。使信息量达到最
,
4 ̄ned等著.战晓苏等译
小。这样有利于集中关注那些与所处理问题相关的数据。
2.《面向.NET的xML程序设计)高等教育出版社微软公司著
(4)数据处理。为了处理数据必须有一个结构来提供上下
3.(Asp.NET XML高级壕程》清华大学出版社Chris l ̄owles.Stephcn
Mohr等著.刘爽译
版权声明:本文标题:浅谈XML与HTML的异同 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1713483910a636947.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论