admin 管理员组

文章数量: 1184232


2024年4月20日发(作者:vertical garden)

维普资讯

第28卷第5期 

计算机工程 

2002年5月 

vo1 28 №5 

Computer Engineering 

May2002 

・ 

I士论文・ 文章鳙号:1o0o— 28(2oo2)o5—邶哪6—02 文献标识码:A 中围分类号:TP312 

基于XML的图形结构数据表示的解决方案及其比较 

陈息红_,许 .镘 

(1中国科学技术大学计算机系,台肥230027;2芜湖职业技术学院计算机系t芜湘24l001】 

摘要:可扩晨撩识语言XML的文档内部采用树形结掏,因而对图形结掏的数据缺乏直接的表示手蜃。请文提出了两种基于XML的图形结 

构数据表示的舸决 寨,井对其特点进行了比较。 

关挂诃:可扩展标识语言;辩形结掏;图形结掏;属性;可扩展的链接语言 

XML.based Representation Methods for Graphic-structured Data 

and Their Comparision 

CHEN E 帆 XU Dou ̄,QIAN Hai 

(1_Department0[ ̄CmnputerScience,University ofScience andTechnology ofChina,Hefei 230027; 

Department o ̄O*mputer T妯nD10好,Wuhu ProfessJo.al Technology College,Wuhu 241001) 

IAb ̄la-act l XML document adopts the tre ̄.str.ctBeed represe ̄talion thus it lacks of direct mlgai ̄to support the graphic_structured data. 

ThispaperproposeslwoXML-based appr ̄chesto solvetheproblem and comparestheirfeatures. 

[Keywords]ExtensibleMarhIpLan|uag删L);Teee-slructu ̄e;Graphit-structure;Attribute;eXtensibleLinkingLanguage(XLL) 

1问题的提出 

对其特点进行了比较。 

可扩展标调语言XML以其台理的数据组织结构、面向 

数据的描述方法和可扩展的特性,成为表示和处理各种数据 

形式的良好工具。xML文档内部采用元素嵌謇的形式组成 

树形结构来描述数据。如下面是一十表示某系职工和论文列 

表的xⅫL文档: 

< ̄xml version=。】0 encoding=”gb2312 7> 

<!DOCTYPE系SYSTEM 系DTD > 

(系> 

(系名>计算机科学与技术‘僳名> 

(职工刊袁> 

(职工>(姓名>事凯础名><性剐>男 性别>.‘椰江> 

圈1 X2eIL文档的树形结构 

< 工)硼工> 

职工列袁> 

<论文列袁> 

<论文><论文名>论文名l 论文名>(摘要>摘要I 摘要> 

‘,论文> 

(论文>. 论文 

‘,论文列袁> 

系> 

此文档的结构如图1所示。xⅫL文档的树形结构使得数 

据之间的关系明确而清晰,广泛适用于各种结构化与半结构 

2两种解决方法 

化的数据形式。但同时也带来了一定的局限性.如对于由相 

2.1基于一性曲方法 

互之阃具有复杂联系的数据组成的图形数据结构,XML就 

缺乏直接的描述方法。 

图2表示的是职工列袁和论文列表中数据间的相互联 

基金项目:安徽省冉然科学基金资助项目{01042302);安徽省教 

系,职工1是职工2和3的上级,①、②、③分别表示职工为 

委自然科学研究赍助项目(2002KJ328ZC) 

作者瞥介:陈恩虹(1968~),男,博士、副教授 研究方向:人工 

论文的第一、第二、第三作者。欲在如上XML文档中表示 

智能,网络信息齄索与挖掘;许斗,淠师、硕士;钱海 博士 

出数据间鞋系,依靠XML文档的树形结构是很难实现的。 

生 

对于类似的图形数据联系,本文给出了两种解决方案并 

收■H囊:2001—07-I3 

维普资讯

XML的属性一般用于描述元素的附加信息。按照W3C 

指定的<PO元素。XPoimer(XML指针语言)定义文档的各部 

建议XML 1 的说明,XML属性有3种类型:字符串类 

分如何寻址。它使得xML的链接不仅可以指向文档.还可 

型、一组记号化类型和枚举类型。其中较多使用的是字符串 

以指向XML文档内部的一个或多个节点、文本段、位置 

类型和枚举类型.记号化类型相对使用较少。记号化类型的 

点、范围或集合,而这些被指向的部分均无须文档提供类似 

BNF定义为: 

于HTML中nameJ ̄=性的特殊标记。 

TokenizedType:=。ID。{。IDREF{。IDREFS’{。ENTITY’ 

XLink和XPoirtter的结合可以很方便地表示文档肉节点 

{。ENTIT LES’I。NMTOKEN’I。NMTOKENS。 

之间的联系。如要实现图2中”职I3是论文4的第二作者“这 

其中ID类型属性为元素的唯一标识,每个元素只能有一个 

联系,可在对应的”职工”和”论文”节点中加入一一个简单链 

ID类型属性。IDREF ̄IDREFS类型属性可以引用ID属性的 接点: 

值(IDREF只能引用一个,IDPJiFS可以引用多个)。结合使用 

<职工ID='ZG03% 

ID和IDREF(s)类型的属性可以建立数据节点之向的联系。 

具体方法是:将被引用的节点加上ID属性.在引用节点中通 

<发表论文xmlns:xlink=。h愤p://www w3 0 [999/xlink。xlink: 

过IDREF(S)类型属性实现对对象的引用。如下面的XML文 

lype=-。simple。xlink:bref= ̄#LW04。xlirtk:show= ilew。xlink:acttlate= 

档表示出了图2中各职工节点和论文节点间的联系: 

onRequesf/> 

< m1 version='l encoding=”gb23 12”’> 

职工’ 

<!DOCTYPE系SYSTEM”著DTD”> 

厦: 

‘系’ 

<论文ID='LW04'> 

<名称,计算机科学与技术 名称> 

<职工列表) 

<第二作者 w3 0 I999/xlink。xfink: 

<职工ID 。ZGOI 发表论文 LW0I.LW02,LW03”> 职工> 

帅仁。simple'xlink:hn ̄f_-'#ZG03。xlink:show='embed xlink:actuate=。 

<职工ID= ZG02 上级;“ZG01”发表论文=“LW02.LW03. 

∞L 

LW04 >... 职工> 

论文> 

<职工ID=-”ZG03 上级:”ZG0I 发表论文=”LW03.LW04 > 

可以通过使用DTD文件中属性说明的确定值或默认值 

.. 

职工) 

来简化实际的XML文件。例如,在DTD文件中对”发表论文” 

职工列表> 

元素有如下说明: 

<论文列表) 

<!ELEMENT发表论文EMPTY> 

<论文ID=”LW0I 第一作者=砌1 > 、. 论文> 

<!ATTLIST发表论文xmlns:xlirtk CDATA#FIXED'htt:p://www 

<论文ID=”LW02 第一作者=”ZGO1”第二作者= ZG02”) 

w3 orgtI999/xlink’ 

... 

论文> 

xSnk:type CDATA#FIXED'simple。 

<论文ID= LW03”第一作者= ZG03”第二作者=”ZG02”第三 

xSnk:hrefCDATA#REQUIRED 

作者=”ZGO1“). . 论文> 

xlink:show(new J replace I embed)。ne 

<论文ID= LW04”第一作者= ZG02 第二作者:”ZG03”> 

xlink:acluate(onLoadlonReques0'onRequest'> 

... 

论文> 

则在XML文档中,以下节点与前面的”发表论文 节点等价. 

论文列表) 

<发表论文xlink:href= ̄LW047> 

系> 

只有有效的Ⅺ札文档,即遵循某个DTD规定的文档, 

3两种方挂的比较 

才会具有ID,IDREF ̄I1DREFS类型的属性。在没有DTD的 

XML的各项标准尚未成熟,还在不断发展之中。如 

XML文档中.xML解析器会将以上属性统统解析为CDATA 

Xlink和Xpointer目前还不是WWW联盟(W3C)的正式推荐标 

类型,尽管有的属性名叫柞ID。而CDATA类型的属性即使 

Xlink是计划推荐的标准,Xpointer ̄:Z作草案,还可能 

有相同的值.也只是独立的值,不能建立节点之问的联系。 

会有较大的改动。因此对这两种方案的比较具有一定的不确 

所以,在DI"D文件”系.DTD”中应对节点”职工”和”论文”加 

定性。我们试图从标准设计原则的角度对以下几个方面的比 

较进行讨论。 

上以下属性列表声明: 

<!ATTLIST职工ID ID #REQUIRED 

(I)联系的意义 

上级IDREF#IMPLIED 

方案I的联系是建立在”引用”的意义上。IDREF(S)类型 

发表论文IDREFS#IMPLIED> 

属性的具体意义及实现方法目前尚不明了.但依赖属性间的 

< ATTLlsT论文第一作者IDREF#IMPLIED 

相互作用而实现的联系应该是一种在独立实体之间虚拟的联 

第二作者IDREF#IMPLIED 

系,具体实现需借甩其他手段,如xS 。 

第三作者IDREF#IMPLIED> 

而方案2的意义则为“链接”。 链接“的意义目前已经比 

2.2 ̄-T-XLL的方法 

较具体化和现实化,其具体目的是提供一种到达或调用对方 

XLL是XML的附加标准.包括了)(1inkI ̄I和x口oint ̄ 。 

的手段。XML对链接的种类和手段的扩展使连接的实现方 

XLink(XML链接语言)定义一文档如何与另一文档的链接。 

法更加丰富多彩。 

包含丰富的链接种类.如简单链接、双向链接、一对多、 

(2)灵活度 

多对一、多对多的链接、扩展链接、外联链接、间接链接 

方案I的实现依赖于ID类型和IDRE Fcs)类型属性的相互 

等.并且对链接的具体特性如链接时间和链接方式等也提供 

作用.如果被引用的节点没有ID类型的属性,引用节点也就 

了多种选择。XML的任意元素均可被用作链接点,而不是 失去了引用目标。 (下转第l9页) 

维普资讯

m Il 嚣 _l ll 

一 

室: 

信息发 系统 

磊 

一 一 

管理对象 本文提出并在实际中得到应用的方案 

吸取了目前计算机网络C/S与B/S模式中各自的忧点.使原 

图5集成熏境律熏结构 

有管理系统得到平稳过渡;・解决了大部分Web页数据的动态更 

统运行安全与高效率。 

新;-解决了数据服务器数据的集中、统一、安生管理与客户机 

4.3系统的拓扑结构 

的职能化、个性化的管理闸厦.并使两者相统一 ・提供了更开放 

杭州市”数字林业“工程网络平台建设包括市信息交换与 

的环境,有利于新拄术的吸收与应用;-不仅具有先进性.也具有 

可靠性、安全性及可扩充性。 

管理中心及下辖市、县、区信息交换与管理中心建设以及相 

参考文靛 

互之间的连接。它是一个集信息收集、组织、加工、利用与 

1袁膀飞lrtttart ̄t网络建设与应用开发北京:人民邮电出版社,1999 

发布于一体的集成札平台。其网络的拓扑结构如图6所示。 

2万博通公司拄术部网络系统集成实用拄术与方案设计指南北京: 

图6可见,信息交换与管理中心的各管理系统分别由各 

海洋出版社,1999 

职能处来管理与维护.中心的主要任务是信息发布以及信息 

3方陆朝.吴选胜.唐丽华斯『工省主要经井树种在线眷街系统的设计 

安全与网络、数据性能的监控,并且利用虚拟网络技术把物 

与实践浙扛林学院学报,2000.17(4):441・444 

4贾克斌,常武艺,张鸿源等ClienttServer和Browse/Server两种模式 

理上分散的各信息交换与管理中心组织在同一个逻辑嗣内。 

台用的高校设备物资管理系统计算机工程,2000.2600):86—88 

5体会 

★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★ 

(上接第7页) 上指向的是一个统一资源标识符URI.因此.它 

可以指向本文档或其它文档的整体或一部分。对 

图3中虚线所示联系的实现方祛是用“文件名桦 

XPointer“的形式给出URI。例如: 

(发表论文xlirtk:href=。电气系XML#LW04'/> 

(4)浏览器的支持程度 

目前尚没有一个浏览器完全支持XML.因 

此,对这两种解决方案均不提供直接的支持。但 

从长远的角度来看.因为XLL的意义明确并且对 

XBL文档(1) mL ̄i ̄(2) 

链接种类和实现手段都作了详细规定,未来的浏 

图3埘L=嘴阔曲t据联熏 

览器可以比较容易地实现对XLL的直接支持。而 

方案2则灵活得多.XPointer提供多种手段实现对目标 

IDREF(S)类型属性本身的意义并不十分确定.因 

的寻址。除了ID属性.XPoiater ̄根据节点位置、节点 

此浏览器难以提供直接实现引用的方法,可能需要依靠其他 

值、属性值、包含的字符串等q-at的方法,因此无须为实现 

手段来实现。 

链接而专门为目标增J¥IBD类型属性。如对lD号为 LW04 

4结束语 

的节点的访河可以采用如下各种形式: 

本文提出了两种基于XML的图形结构数据表示的具体 

#xpointer(M(“LW04“)) 

解决方案.并对其特点进行了比较。如何针对图形结构数据 

#LW04 

和XML文档结构的特点形成一个通用的转换模式.以实现 

#xpoimef(/系,论文列表,论文[posiiton0--4]) 

数据阔的自动转换将是我们下一步的研究内容。 

#xpoimer(//论文[posidDnO--4]) 

参考文献 

l ,4 

I Extensib]e MⅡhp Language(XM 1 0(Second Edition)W3C 

Apointef(/系,论文列表,论文【论文名: 论文名4”1) 

Recommendation.ht ̄:/#,vww w3 org/TR/REC—xML 2000一10 

(3)作用范围 

2 XML Lirtking Language。(Link)Version 1 0 W3C Proposed 

方案1R能在文档内部实现。如图3中虚线表示“职7"3” 

Recommendatino-hffp:/,' ̄,vw w3 orgtTR/xlirt ̄,2000-12 

为另一个XML文档(假定结构相同)中“论文I 的第二作者。 

3 XML Pointer Language(XPeirttre)Version j 0 W3C Working Draft, 

http://www w3 org/TR/xptr.2001—0l 

对于这种超出文档外的联系.方案I就无能为力了。 

4 W3C Technical Reports and PublicatiorLs W3C.http://www w3 0 

方案2可以链接到另一个XML文档的内部。XLi ̄k实际 

200I—04 

l9一 

] 


本文标签: 属性 数据 文档 链接 结构