admin 管理员组文章数量: 1086019
2024年4月20日发(作者:iptv管理系统源码下载)
维普资讯
计算机科学2007Vo1.34N0.1
基于DMB手机EPG系统的XML数据存储与传输技术研究 )
吴君林许龙飞赵聚雪司徒浩臻
(暨南大学计算机科学系 广州510632)
摘要数字多媒体广播电子节目指南(D EPG)是数字电视行业内一项重要的应用,也是用户通过手机获取节目
信息的必不可少的工具。在DMB EPG系统中,减小文档大小、改善传输性能非常重要。本文探讨了EPG系统的
XML数据存储技术和基于传输性能的XML数据编码问题 在分析研究DMB EPG协议原理的基础上,设计和实现
了DMB EPG系统的XML数据存储和二元编码过程,并对三种编码方案的性能进行了分析比较。
关键词数字多媒体广播,电子节目指南,纯XML数据库,--%XML
Study of XML Data Storage and Transportation Technology Based on DMB EPG
WU Jun-Lin XU Long-Fei ZHAO Ju-Xue SITU Hao-Zhen
(Department of Computer Science,Jinan University,Guangzhou 510632)
Abstract Digital Multimedia Broadcasting Electronic Programme Guide(DM EPG),is an important application of
digital TV and an indispensably tools for users to know about programs by mobile telephone.In the DMB EPG system.
it’s very important to reduce the document size of transportation and improve transportation efficiency.In this paper.
XML data store technology baseel on EPG systme and XML data encoding problem based on transportation efficiency
are discussed.On the basis of studying a series of protocols,principles of DMB EPG。the DMB EPG XML document
storage scheme and binary encoding process are designed and implemented.Additionally,the efficiency of three enco—
dign schemes is analyzed and compared.
Keywords DM咀,EPG,Native ̄XML database,13ianry XML
1 引言
电子节目指南(Electronic Programme Guide),简称
EPG,是数字电视技术中一项极其重要的应用,是用户获取
大量电视节目信息必不可少的工具,也是优良的广告载体。
随着在DAB基础上发展起来的DMB技术标准已成为移动
手机电视的主流标准。DMB手机电视的电子节目指南
(D EPG)成为数字电视的新兴领域和研究热点。由于
DMB EPG系统采用了基于XML的数据交换技术,减少数据
传输量改进传输性能就变得尤为重要。本文介绍了该系统前
端机的XML数据存储技术以及基于传输性能的XML数据
编码问题,并采用二元XML设计和实现了DMB EPG的编
码器。
目前国际上研究 手机电视(EPG是DMB手机电视
图1 DMB EPG数据流程图
系列产品之一)的主要有英国Gcap媒体集团、德国蓝宝、韩
如图1所示,EPG数据的转换过程经历3层,分别是
国三星,LG、英国1vrP、荷兰爱迪德等。国内的有北京悦龙
数字广播、上海东方明珠、广东移动电视、香港商业电台等。
Session Layer(会话层)、传输层(transport Layer)和网络层
(network layer)。
DMB EPG国内标准尚未出台,国内一些著名高校的专家对
以下仅介绍会话层的数据流程。会话层的输人是一般的
EPG系统的研究主要是基于DVB协议的数字电视EPG,还
较少看到基于啪(DAB)协议方面的EPG研究成果。
无结构的EPG数据,我们将它统一转换为关系数据库数据,
EPG系统是一组系统,我们称之为前端系统和后端系
然后再转换为XML格式的EPG数据。这里的XML数据符
统 前端也就是EPG数据的发送端,后端就是接收终端。因
合EPG的Schema模式文档定义的数据规范;XML文档经过
篇幅关系,本文研究仅涉及其前端系统的相关部分。
二进制编码转换成二进制的EPG数据;这些数据和一些
Header参数经过MOT编码器被封装成MOT对象,MOT对
2 DMB EPG系统的数据存储
象的组成如图2所示。
图1是DMB EPG系统的前端机的EPG数据的转换图。
其中的Header core和header extension由前面header
吴君林硕士研究生,主要研究方向为数据库系统与知识工程,许龙飞教授,主要研究方向为数据库系统与知识工程等。
・ 92・
维普资讯
parameters获得,body由前面的binary EPG data得到 这些
MOT objects被分成一系列的片段(Segment),这些.Segments
就是会话层的输出,如图3所示。
7 bytes variable variable
headerCOf'e I head ̄extension
模式文档作为EPG XML数据库文档的逻辑模型。下面介绍
该模型的工作机制及每个模块的功能。
(1)xML资源库Ⅺ儿资源库是为XML文件的存储
所申请的空间。由于XML文件按照处理流程可以分为4
类:Original XML,Basic XML,Advance XML,Binary XML,
图2 MOT对象的结构
FiIe
因此在XML资源库中开辟四个子库分别用来存储对应的
XML文件。在图5中,Origialn XML是用来存储从关系数
据库中的结构化数据并经过XML生成器后转换成的XML
文件;Basic XML和Advance XML分别用来存储从Original
XML文档经过XML文件分级器后生成的Basic XML文档
和Advance XML文档;而Biarny XML则用来存储从Basic
I
e
 ̄
r
M
。。∞
hea d
I
te
e
I
。。叩
r Body segroant1 B呻钾s—zI...1呐se唧ntn
、/‘\ ≮ …/一\ / \ /
Segmentation Segment Segmentation Segment
header hesder
图3对象分块图
我们针对会话层的数据转换过程设计了一种数据处理模
型,如图4所示。
图4 session Layer数据处理模型
在这个模型中有4个子模块,分别是XML文档转换器、
XML分级器、XML文档编码器以及位于这3个模块中心的
XML文档数据库,我们称之为EPG XML数据库。DMB
EPG以XML文件作为分级编码的单位,所以XML数据库
以文件作为EPG数据的存储单位。下面根据EPG数据的特
点提出一种EPG XML数据库设计方案。
在这个模型中,数据源经过XML转换器转换为符合
Schema模式的XML文档,这些文档存储在xML文档数据
库资源库中。XML文档分级器取出资源库中的XML文件,
将其分割成Basic Profile和Advance profile 2个级别的文件,
并将分级后的文件存储在XML资源库中。编码器取出分级
后的XML文件将其编码成Bianry XML文件,再将其存入
XML资源库中。数据源在经过以上处理过程后,便可以将资
源库中Bianry xml文件上传到MOT编码器进行后续处理。
Ⅺ咀 级器 文件分 l origina1Ⅺ儿l
}关系I XML
编
程 I BasicⅪ儿l
塑塑壁F 生成嚣 接 l - AdvanceXML l
XML 口 I BinaryXML I
文档编码器 XML资源库
_
图5 EPG XML数据库模型
如图5所示,它是基于文本的纯XML数据库,以文档作
为数据的存储单位,对XML数据库的读取查询更新操作都
是以文本进和文本出的方式进行的 该数据库中的每个文档
都对应一个逻辑模型,由于EPG数据是采用Schema模式定
义的,XML文档也必须符合epgSchedule-11.xsd,epgSI…
11.xsd.,epgDataTypes.xsd三个模式文档,我们便将这三个
XML和Advance XML中的文档经过XML文档编码器生成
的二进制XML文件。
(2)编程接口EPG xML数据库根据需要提供了一系
列供客户端调用的编程接口,包括将Origianl XML文件分级
的接口,生成xML文件的接口 XML文档编码的接口,还保
留了一些暂未实现的接口,如XML文件的查询添加修改删
除等接口。
(3)索引管理在xML资源库中建立如下的索引方案,
用户可根据这种索引来查询获取需要的文件。由于资源库以
文件作为存储的基本单位,因此建立索引也是通过文件名来
建立索引。
(4)存储管理EPG XML数据库的存储管理是以XML
文件为存储单位进行的。
3 XML的传输性能问题
随着基于XML的数据交换技术的应用的深入,业界发
现XML的一个越来越无法忍受的缺点,即:效能缓慢。该问
题促使我们设法加速XML的流量,改善XML的传输性能,
这就引出了XML的数据表示问题,也有人称之为XML数据
的“肥胖”问题。
在改进XML传输性能的这个问题上,目前可用的方案
有:ASCII编码,压缩编码如GZIP,为XML专门设计的编码
以及二元xM 等。
(1)AsCII编码。为计算机提供了一种存储数据和与其
他计算机及程序交换数据的方式。XML文档最原始的编码
方式便是采用ASCII的编码机制。
(2)压缩编码,如GZIP。这种编码严格遵循XML文本
特性,是基于文本的转换。这种类型的转换主要和文档大小
有关。这种类型的任何算法都能方便地用于XML文档的文
本表示。这类算法一般不会改善文档的处理速度,因为增加
了压缩和解压缩的时间。
(3)专门设计的XML编码,如XMill,XBIS等。这类编
码比一般的基于文本的转换更进一步。设计这种类型的方法
是为了通过某种编码表示,以能够减少文档大小、降低处理开
销或者二者兼具的方式利用XML的结构。从编码形式上重
构原来的文档,仅仅损失XML认为无关的那些信息。由于
损失了信息,原始文档和重构后的文档进行直接文本比较,可
能不同,但是对于符合XML规则的任何应用程序而言它们
是等价的。
(4)二元XML。目前还没有一个通用的标准,一般根据
应用程序使用的文档结构量身定做,发送方和接收方必须事
先就具体的结构达成一致,并且实现适当的编码程序/解码程
序,针对应用程序定制编码的多数方法都是基于交换文档的
・ 93 ・
维普资讯
W3C XML Schema规范。模式中包含的类型和结构信息用 每个二进制对象只含有一个顶级元素(top level ele—
于生成定制的编码程序/解码程序代码,可能包括能够代表文
ment)。
档数据内容并直接与编码程序/解码程序交互的对象[5]。它
4.1.2元素编码结构
的优势在于采用二元格式后。传输代价和执行效能都有了显
element-tag这个字节用来标志元素类型,每个ele—
著提高。然而它的劣势也是明显的,目前只应用于特定行业、
ment-tag标示一个唯一类型的元素,它和element之间是1—1
特定用途,存在应用范围小,不兼容、丧失互通性的问题[7]。
对应的关系,如果将来需要添加新的元素扩展,这里保留的未
美国的二元xML标准化工作组已申请国家专利研究该课
定义的Tag可供将来扩展之用。E1ement-length这个字节
题 。
用来标示这个元素包含的data的长度,注意它不包括本身的
二元XML有WBXML,PIX)M,采用ASN.1规则的二进
tag和length部分,但是包括子元素或属性的tag和length部
制XML编码三类编码方式_gJ。
分。如果data的长度大于0xFD,小于等于2 一1,则用一个
额外的16位的extended--elemenLlength来标示数据长度,
4采用二元XML为DMB EPG编码
此时element-length等于0xFE,当解码时读到element-
由于DMB EPG的带宽有限,终端接收设备的内存容量
length等于OxFE,则自动根据下2个字节来确定data的长
以及处理器都是非常宝贵的资源,尽量压缩数据的传输量对
度。如果data的长度大于等于2 小于2 一1,则用一个额外
于降低传输消耗,减小终端设备的负担是非常必要的,DMB
的24位的extende(L_elmeenLlength来标示数据长度,此时
EPG采用Binary XML的编码方案[2],由于W3C尚没有建立
elmeent length等于0xFF,同理当解码时读到elmeent-length
一
套通用的标准,ETSI建立一套广播系统(行业内)通用的二
等于0xFF,则自动根据下2个字节来确定data的长度。El-
进制编码规范口 ]。采用二元XML显著降低了数据的传输
ement-data__type:这段字节包含了该元素的属性,CDATA
量,改善了传输性能。下面重点介绍DMB EPG的二进制编
(字符串)以及子元素的编码。它们按照属性。子元素,CDA—
码协议以及我们针对该协议所设计的编码算法。
TA的顺序进行编码。
4.1 Binary XML编码协议
4.1.3属性编码
4.1.1编码模式
Syntax Size Type
EPG采用tag-length-value的模式进行编码,每个元素和
attribute0{
属性都有一个其独有的标识Tag,然后是标示该元素或属性
attribute
_
tag 8bits uimsbf
含有数据的长度(以字节数为单位)Length标识,最后是数据
attributeJength 8bits uimsbf
if(atla'ibuteJength==OxlaE){
部分,如图6所示。
extended_attributeJength 16bits uimsbf
}
Tag l ̄ngth l Value l aTg I Lens ̄
if(atUibute..1ength---OxFF){
extended_atm'buteJengfla 24bist uimsbf
}
图6编码模式结构
for(i=O;i<attfibute lengthor
exmnde ̄attifbute_length;i++){ 8 bist uimsbf
这种编码结构可以使接收终端很方便地跳过那些它不需
attribute
_
data_byte
}】
要的数据或者终端无法识别的数据。为了便于描述协议,可
使用类似于C语言的伪代码描述,某些词语是缩写词,如
图9属性编码结构
Uimsb表示Unsigned integer,Most significant bit first。生成
最终二进制对象可以用图7描述。
如图9所示,属性编码结构类似于元素结点的编码,这里
不再做详细解释。需要注意的是;如果一个属性存在默认的
Syntax Size Type
属性值,当该属性取默认值时,该属性不必编码,其所在的元
binary_object0{
素结点无须将该属性的编码包含进去,因为如果一个属性取
top_Jevel_elememan()
默认值,当终端解码时找不到该属性的tag时就自动认为该
图7二进制对象结构
属性取默认值,从而减少信息通信的代价。
4.1.4 CDATA和String的编码
Syntax Size Type
Syntax Size Type
elementO{ cd8‘a(){
element.tag 8bits uimsbf
 ̄da ̄..tag 8 bits ulmsbf
elementAength 8bist uimsbf
edata length 8bist uimabf
if(ele咖Uengtll; x {
if(cdata_length--=Oxl ̄){
extended
_
elementJength 16 bjts uimsbf
extended
cdata..1ength 16bist uimsbf
_
}
if(eicmeatAen ̄{
if(‘ la leng出神xFF){
Extended
_
clement
_
length 24 bits uimsbf
Extended cdata
_
length 42bits uimsbf
} }
for(i=O;i<elemendength or for(i=0;i<cdata_iengthor
extended_element_length;i++){ 8bRs uimsbf
extended
_
element_length;i++){ 8 bits uimsbf
element_data
_
byte cdata_data.byte
}】
}】
图8元素编码结构图
图10 CDATA和String的编码结构
・94・
维普资讯
所有的CDATA和String部分(除了属性值String外)的
编码结构如图1O所示,所有的cdata--tag都为OxO1,其他部
分含义类似于上面的解释。值得提出的是,这里CDATA和
String只适合对元素结点值,而不适合属性值,所有的CDA—
TA和String将采用UTF_8编码(见ISO/IEC 10646_4]),在
0xE000和O)【F8FF之间的用户自定义字符区的编码将被忽
Public byte[]code(nodeType node)
{
bytbe ̄!binaryData;//存储的编码后的byte数组
byte口attribute,//存储所有属性的编码
byte口element ̄//存储子元素的编码
yte LJ temp=null,//连接各个编码部分的临时byte数组
byte[]cdata;//存储节点cdata部分编码
byte tag--node.tag;//由协议定义
byte口length,//根据data字节的长度来确定使用几个字节的
length来标示长度
if(node==nul1)
Return null i
略,因为终端是无法对这些编码解码展示的
4.1.5枚举类型编码
由于枚举类型的属性值的数量有限,可以对每种属性采
While(node has attributes which isn t coded){
Attribute=codeAtt ute(att ute(i));//对属性编码
用一个字节的编码,终端解码器读取该字节时便自动将其影
射为相应的枚举属性值。
temp--ConeatBytes(temp,attirbute);//返回连接temp和attrib—
ute字节数组)
W hile(node has more child Elements)
{ element=code(ChildElement)
//对子节点编码,同一类型的节点可共用一个编码接121,不同节点
4.1.6其他公共数据类型编码
其他公共类型编码根据数据的特有的类型和结构设计编
码,譬如属性version采用16位无符号整数等。
4.2基于EISI 371协议编码器的设计
基于ETSI 371协议编码算法的设计思路:
(1)首先根据协议,属性编码结构设计所有共用的属性类
型编码为:
属性tag l 属性length l 属性值data
(z)根据编码协议,枚举类型属性编码结构设计所有的枚
举类型编码是:
(3)根据协议,设计节点类型的编码结构java的byte[]
数组对象A,由八length得到该节点的长度。
(4)解析XML文件生成树,然后对XML树进行深度优
先搜索的一次遍历。如图l1所示,遍历的顺序依次是1,2,
5,3,6,7,1O,l1,8,4,9。
图11 XML树的遍历(深度优先搜索)
当访问节点时:
a)如果属性部分不为空,则对属性部分编码;
b)如果是非叶子节点,访问各个子节点的编码,并返回子
节点的编码的byte数组;
c)如果存在节点值CADA或者Strign,则对Strign部分
编码}
d)连接以上编码byte数组得到该节点的length ̄
e)连接该节点的tag,length,data部分,组成该节点的
编码byte数组
伪码表示为:
类型重载此接口。
temp concatBytes(temp,elemenO;
//返回连接temp和attribute字节数组
)
if(node has CDATA or String)f
cdata=Code(edata or string);
temp—coneatBytes(temp,edata);
//返回连接temp和cdata字节数组
}
if(t哪p一=nul1)
//此元素没有属性也没有子元索和CDATA部分
(Length=new byte[1/ Length(o]=oxol;}
else
length7 getLengthFromData(temp.1ength)}
//根帮data的长度确定lengtb的罕节长度(1,3,4)并返回Length
部分的编码,temp.1ength表示temp数组的长度.
element=ConeatBytes(tag,length,temp);
return element,
、
4.3 BinaryXML性能分析
在采用Binary XML为EPG编码后,我们从理论分析和
实验上分别采用ASCII编码,GZIP压缩编码,以及采用Bina-
ry xML编码,读一个EPG XML文件,写一个EPG XML文
件所需要的时间,以及各种编码文档占用的存储空间,结果如
表1所示。
表1 3种编码性能的比较表
—\
.
性能指标、\
编码方案
ASCII GZIP En
Bi
c
nary
doing
Read Time 较快 较慢 较快
Write Time 较快 较慢 较慢
Document Size 大 较小 较小
在表1中,先看读时间,由于读GZIP文本时首先要解压
缩还原成XML文挡,因此相对AScII编码读速度较慢,而在
读Binary XML时,可以直接根据二进制编码结构读取,不需
要还原成XML文挡,所以读速度较快。再看写时间,由于
GZIP增加了压缩时间,Binary编码增加了解析XML结构然
后编码的时间,因此后两种写速度都较慢。最后看三种编码
方案后文挡大小,由于GZIP的压缩,二元编码的重构,后两
种方案在不同程度上都减小了文挡大小。由于终端更为关注
文档的表示大小以及读取的速度,因此二元XML得到了青
睐。
由于XML文档的传输性能主要取决于xML文档转换
后的大小,经过一定数量EPG XML文档的实验后,就XML
文档的几种编码后的大小进行比较,可见GZIP和二元编码
在减小文档大小上效果突出,如图12所示。值得注意的是不
同的文档由于内容不同,即使其ASCII编码大小相同,经过
GZIP压缩或经过本文的Binary Encodign编码后其文档大小
也会可能不同,所以针对某个具体的文档,二元编码不一定比
GZIP压缩比高。
・95・
维普资讯
参考文献
1 ETSI TS 102 818(2005 O1),XML Speciifcation for DAB EPG.
http://www.worlddah.org/ire,aspx?sub一1O
2 ETSI TS 102 371(2005一O1).Transportation and Binary encodig n
for B EPG. http }| .wodddab, org/irc.aspx?sub=10
3 ETSI EN 301 234(1999一O2).Multimedia Objects Transportation—
Protoco1.http://webapp.etsi.org/action/q0P/OP20060519/e ̄
3O1234v020101o.pdf
4 ETsJ TS 300 401(2001 05).Radio Broadcasting totems Digital
Audio Bro:acastding(DAB)to mobile,portable and fixed receiv—
图12 XML的文档编码后的性能比较
总结本文在分析研究了DMB EPG相关协议原理的基
ers.httpt|| n worlddab. org/im aspx?sub=10
5 万常选.XML数据库技术.清华大学出版社,2005
6 Sosnoski E.改善XML的传输性能.http;// .ibm eom/de—
veloperworks/cn/xml/
7 Bayardo R J,Gruhl D,et a1.An EvMuation of Binary XML En—
coding OIPptimizations or Faftst Stream Based XML Processing.ht—
础上,设计实现了DMB EPG的数据存储方案,分析了XML
传输性能问题,并采用二元XML设计,实现了DMB EPG的
编码器,最后分析比较了三种编码的性能。
tp://www2004.org/proceedings/does/lp345..pdf
8 XML Binary(3 11aracterization Working Group.http:// Ⅳw.w3.
进一步的工作有以下几个方面值得研究,如数据经过编
码后的后续处理过程,即文挡封装成MOT对象、分段、打包
和传输技术以及终端如何进一步改善解码技术等。
(上接第80页)
3.3 XR树+XR-Staek算法
org/XMI /Binary/
9 李莉明.二进制XML浅析.计算机与数字工程,2005,33(22):1~
5
的XML索引查询方法能够有效地解决分支路径查询,但是
在Anc__Desc-B 算法中,利用B+树索引能够有效地跳
过后裔列表中所有不参加连接的结点,但是对于祖先列表中
所有不参加的结点,并不能利用B+树索引来有效地跳过,这
这种方法都对相应的XML文档有要求,其所要查询的xML
文档为树形结构。怎样很好地将上述两种XML查询方法中
的优点结合起来,是将来研究的热点之一。
是因为:在祖先列表中无法利用B+树索引直接定位结点的第
一
参考文献
1 Goldman R,W'idom J.DataG',uide:enabling query formulation
and optimization in semistructured databases.In:23th Interna-
ionalf Conference on Very Large DaLta Bases。pages。A1thens,
Greece。1997;436 ̄445
2 Milo T,Sudu n Index structures for path expressions In:7
个可能的祖先结点,需要多次定位才能跳到结点的第一个
可能的祖先结点。为了解决这个问题,XR树索引被提出Ll ,
基于XR树索引不仅能够有效地跳过后裔列表中所有不参加
连接的结点,而且能够跳过祖先列表中所有不参加连接的结
点。例如,图3中若要找到后裔结点9的父结点8,在Anc--
Desc ̄13+算法中不能够一次定位到结点9的父结点,需要多
次在祖先列表中进行定位才能够找到结点9的父结点8,而
XR树+XR-Stack算法能够在祖先列表中一次定位到结点9
的父结点8。
3.4 XlS¥系统
InternationalI Conference on Database Theory,Jerusalem,Israel【,
1999.277~255
3 K,aushik R, mnoy P,Bohannon P,et a1.,Exploiitng Local Simi—
larity for Efj ̄dent Inde:dng of Paths in Graph Structured Data.
In:10th Intemationa1 Conference on Database Theory,San Jose,
Calio:fmia,USA,2002.129~14O
4 Chen Q,Lim A,Orlg K W.D(k)index:An adaptive structura1
summary for graph-structu ̄ed data.In:Proc.of the 2003 ACM
SIGMOD Int1.Conf.on Management of Data,San Diego,Call-
omia,USA,2003.134~144 f
XISS系统_1蛆的主要思想是:将一个正则路径表达式分
解成子路径表达式,将子路径表达式产生的中间结果进行结
5 He Hao,Yang Jun,.Multiresolution Indexing of XML for Fre-
quent Queries.In:Proceecling of the 20th International【Confer-・
ence on Datta Engineering.Boston,USA,2004..683~694
6 Chtung C,Min J,Shim K.APEx:An adaptive path index for
构连接操作得到最终的查询结果,并且该系统支持文档更新
操作。
XISS系统主要由五个索引组成:元素索引、属性索引、结
构索引、名称索引、值索引。这五个索引采用B+树作为索引
结构。
XML data.In:Proe.of the 2002 ACM SIGMOD Int1.Conf.on
Management of Data,Madison,Wisconsin,2002.121~132
7 Cooper B F。Sample N。F"ranklin M J,et a1.A Fast Index for
Semistructured Data.In:Apers P M G,eds.Proee ̄甜ings of the
27th VILDB Intemationa1 Conference on Verv Large Daltabase,
Rome。Italy,SanFrancisco:MorganKaufmannPubllshers,2001.
341~350
xISS系统将正则路径表达式分解成五个基本的子表达
式:(1)单元素单属性子表达式:通过查找元素索引、属性索引
得到查找结果。(2)一个元素和一个属性子表达式:EA.join。
(3)具有两个元素的子表达式:EE-join (4)Kleene eloure
8 Jiang Haifeng,Lu Hongjun,Wang Wei,et a1..X1 Tree:Inde
xing XML Datta for Eficifent Stuctura:I Joins.In;Casati F,et a1.
eds.Proceedings of 19 h IEEE IcDE Intemational Conference on
DaLta Engineerig,Bangalnore,India,2003.253~263
9 Chien S Y,Vagena Z,Zhang Donghui,et a1.Efficient Structura1
Joins on Indexed XML Documents.In:Papadias D,et al,.eds.
Proce, ings of the 28,h VLDB International【Conference on Very
Large Dattabase,Hong Kong,China,2002.263 ̄274
(+,*):KGjoin。(5)子表达式之问的联合操作。将分解的
子表达式所得的中间结果进行连接得到最终的正则路径表达
式的查询结果。
xlSs缺点:只能解决单路径查询,对于分支路径查询效
率较低。
结束语本文主要研究了XML查询技术中的两种主要
1O Li Quanzhong,Moon&Inde)【irig and Querying XML Data for
Regular Path Expressiona.In:Proceedigs nof the 27thⅥ.DB On-C-
ference,Roma,Italy,2001.361~370
11 Wirth 51.Type Extenslons.ACM Transactions on Programmig n
Language and Systems,1988,16(2):204 214
12 Dimtz P E Maintaining CtPrder in a Linked LAst.In:Lewis H R ed.
Prcoeedings of the 14th Annual【A qCM Symposium on Theory of
Computing.San Francisco,Ca1j.omifa,USA,1982.122~127
方法,其中基于路径索引的XML查询方法只能够解决单路
径查询,但是路径索引的创建不受XML文档结构的约束,即
XML文档可以是树结构,也可以是图结构.。基于编码方式下
・ 96 ・
13 Bruno N,Koudas N,Srivastava I3.I-holistic T"wig Joins:Optimal
XML Pattern Matchig.In:Franklnin M J,ed.Proeeedl[ings of the
21th ACM SIGMOD International【Conference on Management of
Data.Madilson,Wisconsin,UrSA,2003.31O~321
版权声明:本文标题:基于DMB手机EPG系统的XML数据存储与传输技术研究 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1713554492a640487.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论