admin 管理员组

文章数量: 1184232


2024年4月20日发(作者:head at)

维普资讯

・47・ Computer Era No.7 2006 

X E DG E:一种关系模式下的X M L存储策略 

杨海波 ,吴国芳 。董逸生 

(1.东南大学计算机科学与工程系,江苏南京210096;2.绍兴托普信息技术学院) 

摘要:XML已经成为万维网上数据交换的新标准,XML管理也已成为当前的一个研究热点。利用传统的数据库技术 

对XML数据进行管理是可行的。文章提出了一种新的关系模式下的存储策略:XEDGE。它建立在XDGRM的基础上.是 

可扩展的,在同类策略中是较优的。 

关键词:XML;关系;数据库;存储:XEDGE 

0引言 

1998年XML1.0”l正式成为W3C的推荐标准,标志着 

XML的正式面世。从此,XML获得了迅猛地发展。XML正逐 

渐成为互联网数据呈现和交换的新标准,并广泛应用于电子商 

务、电子数据交换、电子图书馆等领域。如何对XML数据进行 

有效管理(如存储和查询)已成为一个急需解决的问题。大体 

上,有三个解决途径 J:一是建立专门的数据库管理系统(Native 

XML DBMS);二是使用面向对象的数据库管理系统(Ob— 

ject-Oriented DBMS);三是使用关系数据库管理系统(Rela- 

tional DBMS)。Xparent( 认为,当要把XML数据存储在关系数 

据库管理系统时,为存储XML数据而进行存储模型设计的问 

题就变成了数据库模式的设计问题。XReP]把数据库模式设计 

分成两类:结构映射策略(structure—mapping strategy)和模型映 

射策略(model—mapping srtategy o前者是在诸如DTD、XML 

SCHEMA等模式文件的帮助下,不预先定义关系模式,而是实 

时进行XML到关系的模式转换。后者的思路是,先建立一个数 

据模型,在没有模式文件的帮助下,根据模型的特点和查询的 

任务,预先定义一个关系数据库模式。 

本文提出了一种新的关系模式下的存储策略:XEDGE。它 

可以归在模型映射策略的门下。与其他模型映射策略类的策略 

相比,有如下优势: 

(1)它建立在XML数据通用参考模型(XDGRM)的基础 

之上。 

(2)扩充了节点类型和边类型,所有的混合元素都有文本 

子节点和文本边。从而使得内部节点都统一起来,更简洁,利于 

边表化。 

(3)有路径信息冗余,显示化路径结构信息,从而有了 

XML数据的全局信息。 

(4)它是一个五表关系模式:元素边表、属性边表、值边表、 

外部路径表、内部路径表。 

(5)试验结果表明,它的查询较优。 

1 XDGRM 

XEDGE策略需要一个XML数据模型的支持。为此,笔者 

设计了一个XML数据模型,即XDGRM,全称是XML数据通 

用参考模型(XML Data General Reference Model o它的主要 

特征如下: 

(1)汲取了OEMt, ̄t、XPatht6 ̄等模型的精华。 

(2)与OEM、XPath等模型相比,具有更好的通用性。 

(3)直接支持XML数据,支持XML数据的有序特性、支 

持有混合内容的元素、支持文档问的链接等。 

(4)是一个以边为中心的XML数据图模型,XML信息集 

中在边上。 

(5)显示化节点之间的关联信息,如元素与元素之间的关 

联、元素与属性之问的关联、元素与文本之间的关联、本文档元 

素与另一个文档中的元素的关联等。 

(6)显示化路径信息。 

(7)面向关系模式。 

为了更好地说明XDGRM,笔者使用了一个XML实例,如 

图1所示。 

图1一个XML实例 

图2是图1中XML实例的XDGRM图表示。 

12 

o元素结点 口文本结点 一 属性结点 

-)引用关系—一元素/子元素关系 

元素/属性关系——◆元素/文本关系 

图2 XML实例的XDGRM表示 

维普资讯

计算机时代2006年第7期 

2 XEDGE 

・48・ 

XMark同时提供了一个综合而简洁的XML查询集合。它 

XEDGE中的“x”含有“XML”、“XDGRM”和可扩展(eX— 

覆盖了XML查询的方方面面。笔者选择了其中几个有代表性 

的查询:Ql、Q2、Q4、Q8、Q9、Qll、Q17、Q19。为了便于说明,使 

tensible)之意。 

 

XEDGE存储策略建立在XDGRM模型的基础上。 

用连续的代号分别代表上面的查询:QM1一QM8。

XDGRM模型直接支持XML数据的建模;XDGRM图以边为 

中心。XDGRM模型中定义了边类型的域,为扩展提供了可能。 

建立在XDGRM模型之上的关系模式是可扩展的,这样做是出 

边表策略和XEDGE策略的代号分别是CL1和CL2。在不 

同策略下生成的关系数据库库名的编码规则是策略代号加 

XML文档代号。 

于以下几点考虑: 

笔者首先在CLIDM1和CL2DMI数据库上做了查询试 

QM2和 

(1)XML的规范还在发展之中,模型存储策略必须能适应 

验,试验结果如图3。发现XEDGE策略除了在QM1、

XML规范的演化。 

(2)容易形成关系模式的核心部分和可扩展部分,以方便 

存储策略的实现。 

XEDGE存储策略建立的关系模式的核心部分是:外部路 

径关系模式、元素边关系模式、属性边关系模式和值边关系模 

式,它们是建立在核心边类型的基础上的。 

外部路径关系对应XDGRM图中的外部简单结构路径信 

息,给用户提供了XML数据的全局视图。 

“外部路径”关系模式是: 

OuterPath(LabelPathlD,Level,LabelPathStr) 

元素边关系与XDGRM模型中的元素边类型(元素与元素 

之问的关联)一一对应。 

“元素边”关系模式是: 

ElementEdge(POID,Ordinal,COlD,TagName,Type, 

LabelPathlD) 

属性边关系与XDGRM模型中的属性边类型(元素与属性 

之间的关联)一一对应。 

“属性边”关系模式是: 

AttributeEdge(OlD,AttrName,ARtYalue,LabelPathlD) 

值边关系与XDGRM模型中的值边类型(元素与文本之间 

的关联)一一对应。 

“值边”关系模式是: 

ValueEdge(OlD,Value,LabelPathlD) 

3试验结果 

XEDGE策略的设计目标是利用商业化的关系数据库管理 

系统来有效地管理XML文档。本文将给出它与其他策略(如边 

表策略 )对比的试验结果。 

试验的软硬条件:操作系统是Microsoft Windows XP 

Professional SP2 2002;中央处理器为1.4GHz;内存为192MB; 

关系数据库引擎采用Microsoft SQL Server 2000 Desktop 

Engine(MSDE 2000)Release A;开发环境采用Microsoft 

Visual C++。 

试验数据和XML查询都来自XMarktn。XMark是一个专 

门的XML测试工程。它提供了一个可伸缩的XML文档数据 

库和一个综合而简洁的XML查询集合。 

笔者通过指定不同的系数,生成了三个测试数据集:28.3MB 

(0.25)、562MB(0.5)和ll3MB(1.())。括号中的数字是产生数据时, 

使用的不同系数。笔者用代号DMI、DM2、DM3分别代表它们。 

QM7查询上优势不明显之外,在其他查询上远优于边表策略。 

这是因为QM1、QM2和QM7的查询相对简单,且查询路径较 

短。也就是说,在简单查询和邻近查询上,XEDGE无法发挥它 

的优势。 

同时发现XEDGE在QM6上查询效率不高。这是因为本 

查询需要在AttributeEdge.AttrValue列和ValueEdge Value列进 

行值连接。但是,ValueEdge Value列所占的空间太大,无法建立 

索引,导致查询效率不高。 

1000.00 

100O0 

州’ 

重 

苔 1

【x1 

0.10 

0.01 

图3不同策略下的查询结果 

最后,做了一个可伸缩性试验,分别在CL2DMI、CL2DM2 

和CL3DM3进行查询,查询结果如图4。结果表明,XEDGE存 

储策略具有良好的可伸缩性。 

8(X) 

7.(KJ 

6(X) 

5(xl 

要4 

是3(x) 

2(X) 

1 00 

0(X) 

LZUMl LZUM2 LZUM3 

图4 XEDGE策略的可伸缩性试验 

通过试验对比,说明XEDGE策略是有效的,且远优于边 

表策略。 

4结束语 

本文给出了一个建立在关系数据库管理系统之上的XML 

存储策略。它是基于XDGRM模型的。该策略的核心是外部路 

维普资讯

・49・ Computer Era No.7 2006 

移动通讯中直放站的远程通信与监控技术的实现 

王鲁贵 

(浙江理工大学,浙江杭州310018) 

摘要:介绍了基于¥3C2410的Windows CE.NET嵌入式系统在直放站通讯与监控中的应用,阐述了在Windows CE 

NET下开发通讯控制系统的详细过程。实践证明,所开发的系统可靠稳定,实时性高。 

关键词:嵌入式系统;RTOS;CDMA.Modem;Windows CE NET 

0引言 

目前,移动通信虽然已经很普及,但是无论何种无线通信 

在其覆盖区域中都将产生弱信号区和盲区。直放站具有性价比 

1系统总体设计 

整个系统如图i所示。 

串口3(调试)I l USB接 C 

高,施工简单等特点,在我国移动网络上有大量的应用。对一些 

偏远地区和用户数不多的盲区,由于架设模拟或数字基站成本 

: : M D 山 

同 l基于¥3C1410的l 同 A I网I 心 

太高,基础设施也较复杂,所以一般采用直放站。直放站的使用 

大大提高了运营商网络的处理能力和覆盖范围,同时也不可避 

免地带来一些问题,具体如下: 

._———— 口』l  —f  Wif的嵌入式系ndows CE.N统fET — 口I l2}H  Mo●  可

■—— d 

e 

 服 务 

站 

t 

匝垂圈 m 

由于直放站要填补基站覆盖不到的区域,因此直放站设备 

分布区域较广,位置大多比较偏远。直放站在整个网络中是孤 

时对故障进行处理,因此给少数用户地区和信号盲区的移动通 

讯设备维护和管理工作带来很大的困难,对整个网络的质量也 

会产生一定程度的影响。 

方案使直放站能与中心服务站直接无线通讯,并且具有自动检 

测连接状态和自动拨号功能,防止不确定因素干扰而使网络连 

接中断。本设计方案采用基于¥3C2410的Windows CE.NET 

的嵌入式系统来实现。 

图1基于嵌入式技术的无线上网直放站组成 

基于¥3C2410的Windows CE.NET的嵌入式系统的无线 

(1)直放站。用于延伸移动通信网络。通过串口1与嵌入式 

系统通信。 

 

立的,一旦出现故障,无法及时获知设备的告警信息,也无法及 

上网直放站主要由以下几部分组成:

(2)USB接口。利用USB的热插拔性能,通过U盘可方便 

(3)CDMA—Modem模块。通过串口2与嵌入式系统连接。 

 

为了解决上述问题,本文设计出一种新的直放站方案。该 

地实现软件的升级和数据更替。

自动拨号程序启动时,对其拨号,以登录网络。 

(4)基于¥3C2410的Windows CE.NET的嵌入式系统。主 

要实现人机交互、数据通信、自动拨号的功能。 

径关系模式、元素边关系模式、属性边关系模式和值边关系模 

式。它们是建立在核心边类型的基础上的。通过试验对比,说明 

XEDGE策略是有效的,且远优于边表策略。 

但是,该策略仍然存在诸多问题: 

(1)如何支持XML数据的更新,如何重构从关系数据库返 

回的结果,这方面没有做深入的研究和相应的试验对比。 

(2)在查询方面,XML查询到SQL查询的转换还处于手工 

阶段。 

An efficient storage model for XML data[C].In Proc Of ADC. 

2002.5(1):85~94 

4】 M Yoshikawa,T Amagasa,T Shimura et a1.XRel:A 

Path-Based Approach to Storage and Retrieval of XML 

Documents using Relational Databases[J1.ACM Transactions 

on Intemet Technology,2001.1(1):110-141 

51 Yannis Pa【pakonstantinou,Hector Garcia-Molina,and Jen nife 

Widom.Object exchange across heterogeneous information 

sources[C1.In Proc Of Infl Conf on Data Engineering(ICDE). 

Taipei,Taiwan.1995:251~260 

上述几个问题都具有很大的挑战性,今后应重点展开研 

究,使得本策略更为实用和高效。 

参考文献: 

【1J World Wide Web Consoritum.Extensible Markup Language 

(XMU[EB/OU.http://www.w3.org/XML/,2006.2.25. 

【2J A Deutsch,M F Fernandez,D Suciu.Storing Semi-structured 

Data with STORED【C】.In Proc of SIGMOD Conference, 

1999:431~442 

6】World Wide Web Consortium.XML Path Language(XPath) 

0[EB/OU.http://www.w3.org/TR/xpath20/,2005.10.29. 

7】Schmidt AR,Waas F,Kersten ML,et a1.The XML benchmark 

project[RI.Amsterdam:CWI,2001 

8J曹亮,王茜,卢菁.XML数据在关系数据库中存储和枪索的研究和实 

现.东南大学学报(自然科学版),2002-32(2):124~128 

9】王晓玲,栾金锋,董逸生.基于演化计算的XML数据的关系存储.计 

【3J H Jiang,H Lu,W Wang et a1.Path materialization revisited: 

算机研究与发展,2003.40(7):1110~1116 田 


本文标签: 模式 关系 策略 查询 数据