admin 管理员组文章数量: 1184232
2024年4月20日发(作者:head at)
维普资讯
・47・ Computer Era No.7 2006
X E DG E:一种关系模式下的X M L存储策略
杨海波 ,吴国芳 。董逸生
(1.东南大学计算机科学与工程系,江苏南京210096;2.绍兴托普信息技术学院)
摘要:XML已经成为万维网上数据交换的新标准,XML管理也已成为当前的一个研究热点。利用传统的数据库技术
对XML数据进行管理是可行的。文章提出了一种新的关系模式下的存储策略:XEDGE。它建立在XDGRM的基础上.是
可扩展的,在同类策略中是较优的。
关键词:XML;关系;数据库;存储:XEDGE
0引言
1998年XML1.0”l正式成为W3C的推荐标准,标志着
XML的正式面世。从此,XML获得了迅猛地发展。XML正逐
渐成为互联网数据呈现和交换的新标准,并广泛应用于电子商
务、电子数据交换、电子图书馆等领域。如何对XML数据进行
有效管理(如存储和查询)已成为一个急需解决的问题。大体
上,有三个解决途径 J:一是建立专门的数据库管理系统(Native
XML DBMS);二是使用面向对象的数据库管理系统(Ob—
ject-Oriented DBMS);三是使用关系数据库管理系统(Rela-
tional DBMS)。Xparent( 认为,当要把XML数据存储在关系数
据库管理系统时,为存储XML数据而进行存储模型设计的问
题就变成了数据库模式的设计问题。XReP]把数据库模式设计
分成两类:结构映射策略(structure—mapping strategy)和模型映
射策略(model—mapping srtategy o前者是在诸如DTD、XML
SCHEMA等模式文件的帮助下,不预先定义关系模式,而是实
时进行XML到关系的模式转换。后者的思路是,先建立一个数
据模型,在没有模式文件的帮助下,根据模型的特点和查询的
任务,预先定义一个关系数据库模式。
本文提出了一种新的关系模式下的存储策略:XEDGE。它
可以归在模型映射策略的门下。与其他模型映射策略类的策略
相比,有如下优势:
(1)它建立在XML数据通用参考模型(XDGRM)的基础
之上。
(2)扩充了节点类型和边类型,所有的混合元素都有文本
子节点和文本边。从而使得内部节点都统一起来,更简洁,利于
边表化。
(3)有路径信息冗余,显示化路径结构信息,从而有了
XML数据的全局信息。
(4)它是一个五表关系模式:元素边表、属性边表、值边表、
外部路径表、内部路径表。
(5)试验结果表明,它的查询较优。
1 XDGRM
XEDGE策略需要一个XML数据模型的支持。为此,笔者
设计了一个XML数据模型,即XDGRM,全称是XML数据通
用参考模型(XML Data General Reference Model o它的主要
特征如下:
(1)汲取了OEMt, ̄t、XPatht6 ̄等模型的精华。
(2)与OEM、XPath等模型相比,具有更好的通用性。
(3)直接支持XML数据,支持XML数据的有序特性、支
持有混合内容的元素、支持文档问的链接等。
(4)是一个以边为中心的XML数据图模型,XML信息集
中在边上。
(5)显示化节点之间的关联信息,如元素与元素之间的关
联、元素与属性之问的关联、元素与文本之间的关联、本文档元
素与另一个文档中的元素的关联等。
(6)显示化路径信息。
(7)面向关系模式。
为了更好地说明XDGRM,笔者使用了一个XML实例,如
图1所示。
图1一个XML实例
图2是图1中XML实例的XDGRM图表示。
12
o元素结点 口文本结点 一 属性结点
-)引用关系—一元素/子元素关系
+
元素/属性关系——◆元素/文本关系
图2 XML实例的XDGRM表示
维普资讯
计算机时代2006年第7期
2 XEDGE
・48・
XMark同时提供了一个综合而简洁的XML查询集合。它
XEDGE中的“x”含有“XML”、“XDGRM”和可扩展(eX—
覆盖了XML查询的方方面面。笔者选择了其中几个有代表性
的查询:Ql、Q2、Q4、Q8、Q9、Qll、Q17、Q19。为了便于说明,使
tensible)之意。
XEDGE存储策略建立在XDGRM模型的基础上。
用连续的代号分别代表上面的查询:QM1一QM8。
XDGRM模型直接支持XML数据的建模;XDGRM图以边为
中心。XDGRM模型中定义了边类型的域,为扩展提供了可能。
建立在XDGRM模型之上的关系模式是可扩展的,这样做是出
边表策略和XEDGE策略的代号分别是CL1和CL2。在不
同策略下生成的关系数据库库名的编码规则是策略代号加
XML文档代号。
于以下几点考虑:
笔者首先在CLIDM1和CL2DMI数据库上做了查询试
QM2和
(1)XML的规范还在发展之中,模型存储策略必须能适应
验,试验结果如图3。发现XEDGE策略除了在QM1、
XML规范的演化。
(2)容易形成关系模式的核心部分和可扩展部分,以方便
存储策略的实现。
XEDGE存储策略建立的关系模式的核心部分是:外部路
径关系模式、元素边关系模式、属性边关系模式和值边关系模
式,它们是建立在核心边类型的基础上的。
外部路径关系对应XDGRM图中的外部简单结构路径信
息,给用户提供了XML数据的全局视图。
“外部路径”关系模式是:
OuterPath(LabelPathlD,Level,LabelPathStr)
元素边关系与XDGRM模型中的元素边类型(元素与元素
之问的关联)一一对应。
“元素边”关系模式是:
ElementEdge(POID,Ordinal,COlD,TagName,Type,
LabelPathlD)
属性边关系与XDGRM模型中的属性边类型(元素与属性
之间的关联)一一对应。
“属性边”关系模式是:
AttributeEdge(OlD,AttrName,ARtYalue,LabelPathlD)
值边关系与XDGRM模型中的值边类型(元素与文本之间
的关联)一一对应。
“值边”关系模式是:
ValueEdge(OlD,Value,LabelPathlD)
3试验结果
XEDGE策略的设计目标是利用商业化的关系数据库管理
系统来有效地管理XML文档。本文将给出它与其他策略(如边
表策略 )对比的试验结果。
试验的软硬条件:操作系统是Microsoft Windows XP
Professional SP2 2002;中央处理器为1.4GHz;内存为192MB;
关系数据库引擎采用Microsoft SQL Server 2000 Desktop
Engine(MSDE 2000)Release A;开发环境采用Microsoft
Visual C++。
试验数据和XML查询都来自XMarktn。XMark是一个专
门的XML测试工程。它提供了一个可伸缩的XML文档数据
库和一个综合而简洁的XML查询集合。
笔者通过指定不同的系数,生成了三个测试数据集:28.3MB
(0.25)、562MB(0.5)和ll3MB(1.())。括号中的数字是产生数据时,
使用的不同系数。笔者用代号DMI、DM2、DM3分别代表它们。
QM7查询上优势不明显之外,在其他查询上远优于边表策略。
这是因为QM1、QM2和QM7的查询相对简单,且查询路径较
短。也就是说,在简单查询和邻近查询上,XEDGE无法发挥它
的优势。
同时发现XEDGE在QM6上查询效率不高。这是因为本
查询需要在AttributeEdge.AttrValue列和ValueEdge Value列进
行值连接。但是,ValueEdge Value列所占的空间太大,无法建立
索引,导致查询效率不高。
1000.00
100O0
州’
重
苔 1
.
【x1
0.10
0.01
图3不同策略下的查询结果
最后,做了一个可伸缩性试验,分别在CL2DMI、CL2DM2
和CL3DM3进行查询,查询结果如图4。结果表明,XEDGE存
储策略具有良好的可伸缩性。
8(X)
7.(KJ
6(X)
5(xl
要4
是3(x)
2(X)
1 00
0(X)
LZUMl LZUM2 LZUM3
图4 XEDGE策略的可伸缩性试验
通过试验对比,说明XEDGE策略是有效的,且远优于边
表策略。
4结束语
本文给出了一个建立在关系数据库管理系统之上的XML
存储策略。它是基于XDGRM模型的。该策略的核心是外部路
维普资讯
・49・ Computer Era No.7 2006
移动通讯中直放站的远程通信与监控技术的实现
王鲁贵
(浙江理工大学,浙江杭州310018)
摘要:介绍了基于¥3C2410的Windows CE.NET嵌入式系统在直放站通讯与监控中的应用,阐述了在Windows CE
NET下开发通讯控制系统的详细过程。实践证明,所开发的系统可靠稳定,实时性高。
关键词:嵌入式系统;RTOS;CDMA.Modem;Windows CE NET
0引言
目前,移动通信虽然已经很普及,但是无论何种无线通信
在其覆盖区域中都将产生弱信号区和盲区。直放站具有性价比
1系统总体设计
整个系统如图i所示。
串口3(调试)I l USB接 C
高,施工简单等特点,在我国移动网络上有大量的应用。对一些
偏远地区和用户数不多的盲区,由于架设模拟或数字基站成本
: : M D 山
同 l基于¥3C1410的l 同 A I网I 心
太高,基础设施也较复杂,所以一般采用直放站。直放站的使用
大大提高了运营商网络的处理能力和覆盖范围,同时也不可避
免地带来一些问题,具体如下:
._———— 口』l —f Wif的嵌入式系ndows CE.N统fET — 口I l2}H Mo● 可
■—— d
e
服 务
站
t
匝垂圈 m
由于直放站要填补基站覆盖不到的区域,因此直放站设备
分布区域较广,位置大多比较偏远。直放站在整个网络中是孤
时对故障进行处理,因此给少数用户地区和信号盲区的移动通
讯设备维护和管理工作带来很大的困难,对整个网络的质量也
会产生一定程度的影响。
方案使直放站能与中心服务站直接无线通讯,并且具有自动检
测连接状态和自动拨号功能,防止不确定因素干扰而使网络连
接中断。本设计方案采用基于¥3C2410的Windows CE.NET
的嵌入式系统来实现。
图1基于嵌入式技术的无线上网直放站组成
基于¥3C2410的Windows CE.NET的嵌入式系统的无线
(1)直放站。用于延伸移动通信网络。通过串口1与嵌入式
系统通信。
立的,一旦出现故障,无法及时获知设备的告警信息,也无法及
上网直放站主要由以下几部分组成:
(2)USB接口。利用USB的热插拔性能,通过U盘可方便
(3)CDMA—Modem模块。通过串口2与嵌入式系统连接。
为了解决上述问题,本文设计出一种新的直放站方案。该
地实现软件的升级和数据更替。
自动拨号程序启动时,对其拨号,以登录网络。
(4)基于¥3C2410的Windows CE.NET的嵌入式系统。主
要实现人机交互、数据通信、自动拨号的功能。
径关系模式、元素边关系模式、属性边关系模式和值边关系模
式。它们是建立在核心边类型的基础上的。通过试验对比,说明
XEDGE策略是有效的,且远优于边表策略。
但是,该策略仍然存在诸多问题:
(1)如何支持XML数据的更新,如何重构从关系数据库返
回的结果,这方面没有做深入的研究和相应的试验对比。
(2)在查询方面,XML查询到SQL查询的转换还处于手工
阶段。
An efficient storage model for XML data[C].In Proc Of ADC.
2002.5(1):85~94
4】 M Yoshikawa,T Amagasa,T Shimura et a1.XRel:A
Path-Based Approach to Storage and Retrieval of XML
Documents using Relational Databases[J1.ACM Transactions
on Intemet Technology,2001.1(1):110-141
51 Yannis Pa【pakonstantinou,Hector Garcia-Molina,and Jen nife
Widom.Object exchange across heterogeneous information
sources[C1.In Proc Of Infl Conf on Data Engineering(ICDE).
Taipei,Taiwan.1995:251~260
上述几个问题都具有很大的挑战性,今后应重点展开研
究,使得本策略更为实用和高效。
参考文献:
【1J World Wide Web Consoritum.Extensible Markup Language
(XMU[EB/OU.http://www.w3.org/XML/,2006.2.25.
【2J A Deutsch,M F Fernandez,D Suciu.Storing Semi-structured
Data with STORED【C】.In Proc of SIGMOD Conference,
1999:431~442
6】World Wide Web Consortium.XML Path Language(XPath)
2
0[EB/OU.http://www.w3.org/TR/xpath20/,2005.10.29.
7】Schmidt AR,Waas F,Kersten ML,et a1.The XML benchmark
project[RI.Amsterdam:CWI,2001
8J曹亮,王茜,卢菁.XML数据在关系数据库中存储和枪索的研究和实
现.东南大学学报(自然科学版),2002-32(2):124~128
9】王晓玲,栾金锋,董逸生.基于演化计算的XML数据的关系存储.计
【3J H Jiang,H Lu,W Wang et a1.Path materialization revisited:
算机研究与发展,2003.40(7):1110~1116 田
版权声明:本文标题:XEDGE:一种关系模式下的XML存储策略 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1713585277a641988.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论