admin 管理员组

文章数量: 1184232


2024年4月19日发(作者:vlookup两表找出相同数)

维普资讯

2007年第1期 福建 电脑 79 

浅谈XML与HTML的异同 

刘珍.李运楼 

(江西工业贸易职业技术学院江西南昌330100) 

【摘 要】:本文主要围绕HTML和XML两种标记语言,通过比较,指出了它们之问的相同和不同之处。虽然均为标记 

语言,HTML主要长于显示数据项,便于数据信息在Wcb上的显示;而XML更方便数据信息的存取、处理、交换、转换,适宜 

不同系统和应用程序之问进行数据交流和整合。 

【关键词】:HTML、XML、相同、不同 

HTML是”超文本标记语言”的英文首字母缩写词。是~种 

用来制作超文本文档的简单标记语言.其英文全称为HyperText 

Mark—uD Language。HTML是SGML的一个子集。而SGML(即 

Standard for General Markup Language,通用标记语言)是一种庞 

大的规范 是由WWW协会(W3C:Word Wild Web Consortium) 

于1986年开发的。用HTML编写的超文本文档称为HTML文 

档.它能独立于各种操作系统平台(如UNIX,WINDOWS等)。自 

1990年以来HTML就一直被用作Wodd Wide Web的信息表示 

语言.用于描述Homepage的格式设计和它与WWW上其它 

Homepage的连结信息。使用HTML语言描述的文件,需要通过 

WWW浏览器显示出效果 

XML.是”可扩展标记语言”的英文缩写词,其英文全称为 

eXtensible Markup aLnguage。1996年W3C又将SGML的格式精 

简后制定、开发出另一种标记语言XML。XML是一套原则,可以 

让各行各业自行定义出如HTML般的标注语言.方便资料存取、 

处理、交换、转换等。XML在使用上比SGML简单,结构上比 

HTML更加严格。XML技术自出现以来,发展非常迅速,在许多 

领域内得到广泛的支持而且有着广阔的应用前景。例如电子数 

据交换、电子商务等等更是把XML作为一种基础性、支柱性的 

技术来看待 

与HTML相J司的是: 

XML也是一种标记语言,同时也是SGML的一个子集,建 

立在放在尖括号中的标记的基础之上。和HTML一样都以一对 

相互匹配的起始和结束标记符来标记信息。作为文本,它们的数 

据具有高度的可移植性和广泛的可部署性。二者文档可以在任 

意标准文本编辑器中创建和编辑。作为普通文本,它们都避开了 

许多与平台相关的问题.非常适合于在Intemet上传输。 

但XML与HTML也存在许多的不同: 

第一、HTML的标记集固定。不能人为扩展。XML的标记集 

并不是固定的.它是一种元语言,允许人为创建其他标记语言或 

者使用他人已经创建的标记语言。正是这种定义新标记的能力, 

使XML成为一种真正的可扩展语言。 

第二、HTML主要用于显示,即数据只是显示项,对数据只 

提供了一个”视图”.如果你想要得到不同的视图的话,必须重新 

生成一个HTiVlL网页 XML主要考虑的是数据及其结构,没有 

假定标记如何在显示设备上显示.仅提供了一种方式,使用我们 

自己 

11-TlvIL示斜 XML 钠 

HTML .e?X.MLVE船10HI¨I,0 S ND^Lom ” 

稍l ID-"MN n棚 <ffr'AT ̄STATEID= MN 

Mi2 n 12‘ Ci竹 }I》 CnYcrrYiD= l2’ 

ot) 州^h噼】ohn,oB叫确皿p 

・ 

‘ T, 蝴_0PU d∞N"OO0计0HJL^ 0N) 

<DD ohm口 D < ̄CITY> 

<DT'-,popuhttionc4DT ̄ cI1YC丌YID-‘l5 ) 

5o0O n ^ME Hr_vilI酬^M色> 

∞L 日,oH几 兀0N O帅O 0PUI I10N 

ID-"1S':,Civ/</Kt ̄ CrTY 

∞L K 

qmH¨ D呵 

DD)Fi ̄ville<tDD 

PD砌州枷 ,D呵 

(DD ∞O咖D' 

∞b 

HT 

从表中我们可看到:HTML标记仅向浏览器描述了该文档 

中数据显示的格式.并没有明确指出数据组成及各数据所代表 

的含义:而XML文档中并不包含浏览器显示格式。它只包含标 

记和数据。并未明确告知浏览器何时换行,何时字体加粗。但 

XML分层展示了数据组成以及它所代表的意义。 

第三、许多HTML标记都只取首字母的缩写词,因此它们不 

如普通语言那么易读。XML标记名便于阅读,且表达了数据的 

含义。每个XML标记就位于相关联数据的前面,这样人和计算 

机都可以容易地识别信息结构。 

第四、在HTML中,数据及其表示逻辑是交叉存取的。 

HTML标记没有给数据的内容添加任何语意含义,仅描述了表 

示信息。这种方式很难以只维护数据或只维护数据的表示方式。 

层叠样式表(CSS)虽然对把数据与其表示格式分隔开来起到了 

定的作用.但许多Weh页面仍在表示标记中存储了数据。标 

记和数据结合在一起.很难进行分割。因此它不允许用户对数据 

进行变换以便进一步进行处理。而XML主要考虑的是数据及其 

结构.在其语法规则上要严格得多,或有”良好的格式”,这要求 

所有的标记都有对应的结束标记.不能重叠。从本质上看,使用 

相同的XML数据文档在不同的设备上显示的结果不同。这种数 

据.q-表示的分离也极大地方便了数据的访问:另外数据结构遵 

循显而易见且有用的模式.使得处理和交换数据更容易。 

第五、HTML中数据不能指定层次,而XML中数据成树形 

等级结构。文档至少包括一个根元素或文档元素,所有的下级元 

素都包含在根元素中 元素之间不能交叉。 

第六、使用HTML搜索如”Tom WolP’编写的书籍时,有可能 

会返回作者上下文之外的术语”wolft。而使用XML可将搜索范 

围限制在适当的上下文(如包含在<author>标记中的信息)之 

内.从而只返回想要的信息类型。使用XML、Web代理程序和智 

能程序(用来使Web搜索或其他任务自动化的程序)将更加有 

教并且产生更有用的结果。 

第七 HTML的格式既不适合机器分析也不适合人阅读它 

的源码.而且格式要求比较松散:HTML解释器采用的是尽量解 

释的机制 这样造成的一个弊病是同一个页面在不同的浏览器 

中可能显示的结果大不相同。而对于XML,我们可以为不同的 

浏览器用不同的样式表转换不同的HTML文档。 

第八、XML的应用并不局限于Web。XML在体系结构上是 

中立的.可以很容易合并到任何应用程序设计中。 

在应用程序开发过程中经常遇到一些与数据相关的问题: 

如何整合数据和自己已有的业务系统以及商业伙伴的业务系 

统7应用XML为该问题的解决提供了方案: 

(1)异构应用程序的集成。公司之问要共享数据,那么这 

数据就必须适用于不同操作系统平台的应用程序。XML数据恰 

好符合要求。 

(2)数据格式的转换。应用程序使用的数据类型没有统一。 

通过使用XML这种适用于所有应用程序的标准数据结构,就可 

以解决这些数据生成的问题。 

(3)数据的搜索与查询。当数据的来源各不(下转第54页) 

维普资讯

福建 电脑 2007年第1期 

伸定义 

(5)DNS—ALG检测到这个DNS报文是来自IPv6网络的, 

1)定义了一个新的资源记录类型(AAAA或A6)将域名和 

于是和NAT通信.NAT从地址池中为该IPv6地址IPv61分配 

IPv6地址作映射: 

个全球唯一的IPv4地址(设为IPv41)映射给主机Host1的 

2)为反向域名解析定义了一种新的域; 

IPv6地址IPv61,建立地址映射关系,并修改DNS报文回答区的 

3)为了能同时处理IPv4和IPv6地址。对现存的附加信息 

目的地址为IPv41。 

区中的查询作了相应的处理 

(6)DNS-ALG再把域名host1.net的类型type从从AA修 

3.2 DNS—AI ; 

改为A.然后回复给IP、,4 DNS。IP、,4 DNS再把这个DNS应答报 

应用级网关ALG是一种允许纯IPv4节点和纯IPv6节点 

文返回给主机Host3。 

之间通信的特殊的应用代理。由于一砦应用级的通信在报文的 

(7)至此。DNS-ALG的工作结束,此后的通信过程则是主机 

负载里携带了网络地址.而NAT一 翻译机制本身对在负载中 

Host3发送源地址=主机Host3的IPv4地址(设为IPv43),目的 

携带了II)地址的应用无能为力,也不会去检测负载的内容,所 

地址=IPv41(I ̄41为与主机Hostl的IP、,6地址IP、r61映射的 

以将ALG与NAT-PT结合起来使用,才能对应用层的多种通 IPv4地址)的IPv4报文给目的地,即主机H0st1。 

信提供有效的支持。 

(8)IP、,4报文被路由到NAT-Pr,NAT查找到映射关系表 

DNS-ALG在应用层对DNS报文进行了相应的处理.使得 

后.把报文中的目的地址由IPv41替换为主机Host1的IPv6地 

报文可以正确反映IPv6站点或者IPv4站点的域名和地址信 

址IPv61。然后为源地址IPv43(主机I-Iost3的IPv4地址)加上前 

息。DNS采用的协议基本上可以视为由客户向服务器发送查询 

缀preifx,源地址成为了pref ̄::IP、,43.之后再对报文进行 的 

报文。服务器回送应答报文。为节约分组内的空间,通常会对域 

工作.生成目的地址=IIN61。源地址=preifx::IPv43的IPv6报 

名采用压缩方法。大多数DNS服务器既支持UDP也支持TCP。 

文。 

通常应答报文采用和查询报文相同的传输服务协议。只做一个 

(9)完成NAT和 的过程后,翻译网关将IPy6报文发 

查询的客户大多使用非连接型的UDP。 出,最终由域名为host1.net的目的主机Ho8t1收到。 

3.3、D 

同理.由IPv6网络发起的域名访问II)v4网络的过程与此 

类似,但在执行过程中有所不同。主要区别存在于DNS查询的 

过程中。IPv6网络中的主机发出的DNS查询转交到DNS—AI_B 

后.DNS-ALG通过访问IPv4 DNS得到要访问的IPv4网络中主 

机的IPv4地址(设为IPv42),然后为其加上前缀px ̄fix,把pre- 

fⅨ::IPv42作为DNS回答报文的目的地址返回给通信的发起 

DNS—ALG翻译网关工作模型 

方,即IPv6网络中的主机。在正式开始通信后IP、,6网络中的主 

下面以IP、,4网络中的主机Ho8t3通过域名访问IPv6网络 

机发送源地址=IPv6网络中发起访问的主机的地址(设为 

中的主机Host1为例来描述DNS—ALC翻译网关的工作过程: 

IPv61),目的地址=preifx::IPv42的IPv6报文,到达NAT后.再 

(1)假设IPv4网络中域名为h0st3.net的主机,Host3希望 

为IPv6地址IPv61分配一个全球唯一的IPv4地址(设为 

与IPv6网 ,域名为host1.net的主机Host1建立连接。为了首先 IPv41),并将prefⅨ::IP、,42取后缀IPv42为目的地址,生成一个 

穿越IPV4网络.主机Host3要先获取主机Hostl用于在IPv4网 源地址=IPv41.目的地址=IPv42的IPv4报文交给IPv4网络中 

络中传送所对应的IPv4地址。因此。主机Host3向IPv4网络的 的主机.至此通信完成 

DNS服务器发送一个DNS请求查询域名host1.net对应的IP、,4 

4.结束语 

地址,但此时DNS请求中域名host1.net的类型type为A(A是 

由于IP、,6与IPv4在DNS记录格式上的差异.无法在IPv6 

IPv4 DNS系统定义的一种资源记录格式)。 网络与IPv4网络之间直接实现DNS查询和响应。本文研究了如 

(2)IPv4 DNS收到DNS请求后检查自己的记录,但由于事 何利用DNS—AIJG应用网关和NAT一 翻译机制构建翻译网 

实上主机Ho8t1在IPv6网络中.因此主机Hostl的域名host1. 关.并描述了DNS—ALG翻译网关在 6网络与IPv4网络之间 

net的DNS资源记录类型type应为A从A(AAAA是IP、r6 DNS 

通过域名进行访问的工作过程。 

系统新定义的一种资源记录格式),查找失败。随后IP、,4 DNS将 

此DNS请求转交出去 

参考文献: 

(3)DNS_ALG拦截到该DNS请求,发现该DNS报文是一 

1.G.TSirtSis.P.Smuresh.R_FC2766.Network Address Tran ̄tion—pro- 

个从IPv4网络发来的请求。于是将资源记录。即域名host1.net 

tO ̄O1 Tran ̄tion(NAT一 .February 2o0o 

的类型type值从A修改为A从A然后转发到IP、,6 DNS。 

2.P.Srisuresh,G.1 血is,P.AkldraiU.II.FC2694.DNS extensior ̄to NCt- 

(4)IPv6 DNS收到这个DNS请求后查找自己的记录,得到 

WOrk Addre ̄Tramlaton(DNS,^IG)September 1999 

域名host1.net对应的IP、,6地址(设为IP、,61)。于是将这个地址 

3.R.Gilligan.E.Nordm ̄k.R C2893

 ̄rrami6on Mcchanisms for IP 

填入到DNS应答报文回答区的目的地址中.此时DNS报文的 

Hos包and t1.oute ̄.August 2oo0 

type依然填AAAA,并回复给DNS—ALG。 

4.S.ThOll ̄Or1.C.Huitcma.RFC1886.DNS Exccf1sions to support IP 

version 6 

(上接第79页) 

相同.格式多种多样时,要找到一个应用程序所需要的数据项就 

文。处理结束后,同样还需要一个结构来进行显示。这些都需要 

会变得非常困难。需将数据转换成XML.浏览其结构或数据容 

用到结构化的XML文档。 

器(在数据存储没有结构的情况下);找到想要的数据后再对它 

进行操作。还可以把不同来源的数据归纳合并成单一的、一致的 

参考文献: 

格式。在此格式下。你可以对数据进行处理、编辑和操作,以解决 

1.(XML.NET蝙程指南>电子工业出版社【蔓lAdam Sills.Mesbah 

具体的问题。此外,利用XML还可以过滤数据。使信息量达到最 

4 ̄ned等著.战晓苏等译 

小。这样有利于集中关注那些与所处理问题相关的数据。 

2.《面向.NET的xML程序设计)高等教育出版社微软公司著 

(4)数据处理。为了处理数据必须有一个结构来提供上下 

3.(Asp.NET XML高级壕程》清华大学出版社Chris l ̄owles.Stephcn 

Mohr等著.刘爽译 


本文标签: 数据 标记 报文