XML文档到关系数据库映射的实现-Linux大棚

admin 管理员组

文章数量: 1184232

2024年4月19日发(作者：php编程软件手机端)

第３２卷第６期　

２０１０年１２月　

武汉理工大学学报・信息与管理工程版　

ＪＯＵＲＮＡＬ　ＯＦ　ＷＵＴ（ＩＮＦＯＲＭＡＴＩＯＮ＆ＭＡＮＡＧＥＭＥＮＴ　ＥＮＧＩＮＥＥＲＩＮＧ）　

Ｖｏ１．３２　Ｎｏ．６　

Ｄｅｃ．２０１０　

文章编号：１００７—１４４Ｘ（２０１０）０６—０９３０—０４　

文献标志码：Ａ　

ＸＭＬ文档到关系数据库映射的实现　

彭其泽　，叶　锋　，肖金生　

（１．武汉理工大学汽车工程学院，湖北武汉４３００７０；２．江汉大学数学与计算机学院，湖北武汉４３００５６）　

摘要：采用以结构为中心的映射方法，抽取ＸＭＬ文档中每个节点的名称、类型、路径和取值等信息，并利用二　

叉树存储，在其后的遍历过程中，将每个节点的信息以记录的形式存储在表Ｄｏｃｕｍｅｎｔ之中，从而实现了ＸＭＬ文　

档到关系数据库的映射。该映射过程不依赖ＸＭＬ　ＤＴＤ或Ｓｃｈｅｍａ，具有通用性，且算法简单，易于实现。　

关键词：ＸＭＬ；关系数据库；数据库映射　

中图分类号：ＴＰ３９１　ＤＯＩ：１０．３９６３／ｊ．ｉｓｓｎ．１００７—１４４Ｘ．２０１０．０６．０１９　

可扩展的标记语言（ｅｘｔｅｎｓｉｂｌｅ　ｍａｒｋｕｐ　ｌａｎ．　

部分可看作树上的一个节点。ＸＭＬ文档树的节　

ｇｕａｇｅ，ＸＭＬ）具有可扩展性、自描述性等特点，使　点类型可分为７种＿１　，包括根、元素、属性、文本、　

其成为应用问交换数据的主要标准之一，但受其　

注释、处理指令和命名空间。在实现ＸＭＬ文档映　

自身的结构特征的限制，使得其查询、更新数据的　

射为关系数据库的过程中，笔者只关注其中的根、　

能力较低。目前常用的解决方法是将ＸＭＬ文档　

元素、属性和文本等４类节点。需要指出的是，尽　

映射为关系数据库，将ＸＭＬ数据存储在关系数据　管属性节点不是其所描述的元素节点的子节点，　

库之中，利用成熟的关系数据库技术对其进行管　但考虑到属性节点在ＸＭＬ文档设计过程中可变　

理，以提高存储和查询效率　』。　

换为子元素节点来代替，故笔者在构造ＸＭＬ文档　

目前，将ＸＭＬ映射为关系数据库有两种方　

树时，把属性节点作为其所描述的元素节点的子　

法　Ｊ。其一是以模式为中心的映射方法，利用　

节点进行处理，但采用标志位对这两类节点进行　

模式如ＸＭＬ　ＤＴＤ或Ｓｃｈｅｍａ实现ＸＭＬ文档到关　区分。在笔者的表示方法中，把属性作为其所描　

系数据库的转换。首先，将ＤＴＤ或Ｓｃｈｅｍａ映射　述的元素的子节点，将属性的取值作为文本节点　

为关系模式；然后遍历ＸＭＬ文档，将提取的数据　处理，称之为属性文本。如＜ｂｏｏｋ　ｓｈｉｐｐｅｄＢｙ：　

插入到相应的关系之中。但这些映射方法需考虑　

”

ｓｌ”＞中ｓｈｉｐｐｅｄＢｙ属性的取值“ｓ１＇’称作为属性　

ＸＭＬ　ＤＴＤ或Ｓｃｈｅｍａ自身的语义约束，否则映射　文本。笔者把介于起始标记和结束标记之间且其　

所得到的关系模式会丢失原有的约束关系。而　

问不再包含其他起始标记和结束标记的文本称为　

ＸＭＬ　ＤＴＤ或Ｓｃｈｅｍａ蕴含的语义约束十分丰富，　

元素文本。如＜ｄｕｒａｔｉｏｎ＞１　ｄａｙｓ＜／ｄｕｒａｔｉｏｎ＞，　

建立通用的映射方法也较困难。此外，大量ＸＭＬ　

在起始标记＜ｄｕｒａｔｉｏｎ＞与结束标记＜／ｄｕｒａｔｉｏｎ＞　

文档没有对应的ＸＭＬ　ＤＴＤ或Ｓｃｈｅｍａ。其二是以　

之间的“１　ｄａｙｓ”称作为元素文本。　

结构为中心的映射方法，其实现依赖于ＸＭＬ文档　

以图１所示的ＸＭＬ文档为例，其所对应的树　

的结构，并不依赖于ＸＭＬ　ＤＴＤ或Ｓｃｈｅｍａ。　

形结构如图２所示。　

笔者采用了以结构为中心的映射方法，并采　

在图２中，椭圆为元素节点；矩形为元素文本　

用单一表Ｄｏｃｕｍｅｎｔ（Ｎｏ，ｎａｍｅ，ｔｙｐｅ，ｐａｔｈ，ｖａｌｕｅ）存　

节点；三角形为属性节点；五角形为属性文本节　

储了根、元素、属性和文本等４类节点，从而实现　点。对于图２中每个节点编程实现时采用的数据　

了ＸＭＬ文档到关系数据库的映射。　

结构如下：　

Ｓｔｒｕｃｔ　ｎｏｄｅ　

１创建ＸＭＬ文档树　

　｛

ＸＭＬ文档可看作一棵文档树，文档中的每一　

Ｉｎｔ　Ｎｏ；　

收稿日期：２０１０—０５—１４．　

作者简介：彭其泽（１９６４一），男，湖北潜江人，武汉理工大学汽车工程学院讲师　

第３２卷第６期　彭其泽，等：ＸＭＬ文档到关系数据库映射的实现　９３１　

图１　ＸＭＬ文档示例　

图２　ＸＭＬ文档树　

Ｓｔｒｉｎｇ　ｎａｍｅ；　

Ｓｔｒｉｎｇ　ｔｙｐｅ；　

Ｓｔｒｉｎｇ　ｖａｌｕｅ；　

Ｓｔｒｉｎｇ　ｐａｔｈ；　

Ｓｔｒｕｃｔ：ｌ：ｌＣｈｉｌｄ；　

Ｓｔｒｕｃｔ　ｒＢｒｏｔｈｅｒ；　

在Ｓｔｒｕｃｔ　ｎｏｄｅ结构中，ｎａｍｅ为节点的名称；　

ｔｙｐｅ为节点类型，其取值可为Ｒｏｏｔ（根）、Ｅｌｅｍｅｎｔ　

（元素）、Ａｔｔｉｒｂｕｔｅ（属性）、Ｔｅｘｔ（文本）；Ｎｏ为节点　

编号，是对ＸＭＬ文档树进行前序遍历时所访问节　

点的顺序号，在遍历时填写其值。当节点类型取　

值为根、元素和属性时，ｎⅡ胱分别存储根、元素和　

属性的名字，ｖａｌｕｅ取值为ＮＵＬＬ；当节点类型取值　

为文本时，ｖａｌｕｅ取值为该节点的文本值，如果其　

父节点是元素节点，ｎａｍ￣取值为＃ｅｌｅｍＴｅｘｔ，如果　

其父节点是属性节点，ｎａｍｅ取值为＠ａｔｔｒＴｅｘｔ。　

ｐａｔｈ用于存储节点的路径信息，以图２为例，当节　

点为根节点时，ｐａｔｈ的值为“＼ｂｏｏｋｓｔｏｒｅ”；当节点　

为非根节点时，ｐａｔｈ存储从根到该节点的路径，如　

图２中的元素文本节点Ｊａｖａ，ｐａｔｈ为“＼ｂｏｏｋｓｔｏｒｅ＼　

ｂｏｏｋ＼＃”，表示Ｊａｖａ是根节点ｂｏｏｋｓｔｏｒｅ的子节点　

ｂｏｏｋ的元素文本节点。由于元素文本节点没有　

名称，笔者用＃表示其名称。同样，属性文本节点　

也没有名称，用＠表示其名称。如属性文本节点　

ｓｌ，ｐａｔｈ为“＼ｂｏｏｋｓｔｏｒｅ＼ｓｈｉｐｐｉｎｇ＼ｓｈｉｐＩＤ＼＠”，表示　

ｓ１是属性ｓｈｉｐＩＤ的取值，且ｓｈｉｐｌＤ是根节点　

ｂｏｏｋｓｔｏｒｅ的子节点ｓｈｉｐｐｉｎｇ的属性。　

为了便于实现，笔者采用二叉树存储结构存　

储ＸＭＬ文档树，称之为ＸＭＬ文档二叉树，即将　

ＸＭＬ文档树采用孩子兄弟法存储为一棵二叉树，　

图２所示的ＸＭＬ文档树对应的二叉树如图３所　

示。值得注意的是，建立一棵ＸＭＬ文档二叉树并　

不采用ＸＭＬ文档树作为中间过程，而是直接以　

ＸＭＬ文档作为输入建立而成。创建ＸＭＬ文档二　

叉树算法如下：　

图３　ＸＭＬ文档二叉树表示　

（１）扫描ＸＭＬ文档，获取其根，创建ＸＭＬ文　

档二叉树的根节点。　

（２）若ＸＭＬ文档的根存在属性，则获取第一　

个属性，创建该属性节点，作为ＸＭＬ文档二叉树根　

节点的左孩子节点；获取其属性值文本，创建该属　

性文本节点，作为第一个属性节点的左孩子节点。　

（３）如果ＸＭＬ文档的根还存在其他属性，从　

二叉树根节点的左孩子节点（如果根节点存在属　

性节点的话，那么二叉树根节点的左孩子节点是　

第一个属性节点）出发，一直沿右孩子节点路径　

行进，直到某节点的右孩子节点为空，则指定该节　

点为操作节点。获取ＸＭＬ文档的第二个属性，创　

建该属性节点，把该属性节点作为操作节点的右　

孩子节点，并指定该节点为操作节点；获取其属性　

值文本，创建该属性文本节点，作为操作节点的左　

孩子节点。　

（４）按照步骤（３），在ＸＭＬ文档二叉树中建　

立根节点的所有属性及属性值节点。　

（５）如果ＸＭＬ文档的根是一个空元素节点，　

则算法结束，否则转步骤（６）。　

（６）如果ＸＭＬ文档的根不包含子元素，即　

ＸＭＬ文档的根只包含文本，则创建元素文本节　

点。如果ＸＭＬ文档二叉树的根节点左孩子为空，　

则将该元素文本节点作为二叉树根节点的左孩子　

节点，否则从二叉树根节点的左孩子节点出发，一　

直沿右孩子节点路径行进，直到某节点的右孩子　

９３２　武汉理工大学学报・信息与管理工程版　２０１０年ｌ２月　

节点为空，并指定该节点为操作节点，将所创建元　

表１中第２行所示元组（２，ｓｈｉｐｐｉｎｇ，Ｅｌｅ—　

ｍｅｎｔ，＼ｂｏｏｋｓｔｏｒｅ＼ｓｈｉｐｐｉｎｇ，ＮＵＬＬ）表示ｓｈｉｐｐｉｎｇ是　

素文本节点作为操作节点的右孩子节点，算法结　

束。否则，转步骤（７）。　

（７）访问ＸＭＬ文档根的第一个子元素，创建　

该节点。　

（８）ＸＭＬ文档根的第一个子元素是ＸＭＬ文　

档树的一棵子树根节点，故按照步骤（２）～步骤　

（６）构建ＸＭＬ文档根的第一个子元素所对应的　

个元素，是根元素ｂｏｏｋｓｔｏｒｅ的一个子元素。第　

３行所示的元组（３，ｓｈｉｐｐｌＤ，Ａｔｔｒｉｂｕｔｅ，＼ｂｏｏｋｓｔｏｒｅ＼　

一

ｓｈｉｐｐｉｎｇ＼ｓｈｉｐｌＤ，ＮＵＬＬ）表示ｓｈｉｐＩＤ是一个属性，　

是根元素ｂｏｏｋｓｔｏｒｅ的子元素ｓｈｉｐｐｉｎｇ的属性。第　

４行所示的元组（４，＠ａｔｔｒＴｅｘｔ，Ｔｅｘｔ，＼ｂｏｏｋｓｔｏｒｅ＼　

ｓｈｉｐｐｉｎｇ＼ｓｈｉｐｌＤ＼＠，ｓ１）表示根元素ｂｏｏｋｓｔｏｒｅ的　

子二叉树。　

（９）如果二叉树根节点的左孩子节点为空，　

则将子二叉树的根节点作为二叉树根节点的左孩　

子节点，否则从二叉树根节点的左孩子节点出发，　

一

直沿右孩子节点路径行进，直到某节点的右孩　

子节点为空，并指定该节点为操作节点，将子二叉　

树的根节点作为操作节点的右孩子节点。　

（１０）按照步骤（７）～步骤（９），依次访问　

ＸＭＬ文档根的所有子元素，建立相应的子二叉　

树，并插入ＸＭＬ文档二叉树之中。　

２　ＸＭＬ文档树映射到关系数据库　

笔者设计了一种存储模型，使用该模型可把　

格式良好的ＸＭＬ文档存储到关系数据库之中。　

该存储模型采用了一张名为Ｄｏｃｕｍｅｎｔ的关系表，　

该表提供了ＸＭＬ文档存储在关系数据库系统中　

的全局视图，主要存储了每个节点的路径和处于　

叶子节点位置的文本节点的值。Ｄｏｃｕｍｅｎｔ表的　

结构如下：Ｄｏｃｕｍｅｎｔ（Ｎｏ，ｌｚａｌｒｔｅ，ｔｙｐｅ，ｐａｔｈ，ｖａｌｕｅ）。　

其中，Ｎｏ、ｎａｌｎｅ和ｔｐｙｅ的意义与Ｓｔｒｕｃｔ　ｎｏｄｅ中的　

成员变量Ｎｏ、ｒｔａｌ７￣和ｔｐｙｅ的意义相同；ｐａｔｈ为节　

点在ＸＭＬ文档所对应的存储二叉树中的路径；　

ｖａｌｕｅ为文本节点的值，包括属性文本和元素文　

本。以图１所表示的ＸＭＬ文档为例，Ｄｏｃｕｍｅｎｔ　

表如表１所示。　

表１　Ｄｏｃｕｍｅｎｔ表　

子元素ｓｈｉｐｐｉｎｇ的ｓｈｉｐｐｌＤ属性值为“ｓ１”。　

笔者采用了固定的关系模式Ｄｏｃｕｍｅｎｔ存储　

ＸＭＬ文档，因而映射的过程就是遍历ＸＭＬ文档　

二叉树并向Ｄｏｃｕｍｅｎｔ中追加记录的过程。遍历　

ｘＭＬ文档二叉树采用前序遍历。其算法如下：　

（１）建立Ｓｔｒｕｃｔ　ｎｏｄｅ类型的栈Ｓ，并初始化。　

（２）建立指向Ｓｔｒｕｃｔ　ｎｏｄｅ类型的变量Ｐ，并指　

向ＸＭＬ文档二叉树的根节点。　．　

（３）如果Ｐ不为空或栈不为空，则转步骤　

（４），否则算法结束。　

（４）如果Ｐ不为空，则根据Ｐ所指向节点的　

信息构建一条Ｄｏｃｕｍｅｎｔ表的记录，插入Ｄｏｃｕ—　

ｍｅｎｔ表。如果Ｐ为空，则转步骤（６）。　

（５）Ｐ指向的节点人栈，Ｐ指向其左孩子节　

点。转步骤（４）。　

（６）如果栈不为空，栈顶节点出栈，并使Ｐ指　

向该节点。　

（７）Ｐ指向其右孩子节点，转步骤（３）。　

３重构ＸＭＬ文档　

Ｄｏｃｕｍｅｎｔ表中的每行代表一个节点，描述了　

节点的序号、名称、类型、路径和取值。　

由表１第１行可知，ｂｏｏｋｓｔｏｒｅ是重构的ＸＭＬ　

文档根元素。通过序号可以区分两个不同的节　

点，如表１第２行的记录（２，ｓｈｉｐｐｉｎｇ，Ｅｌｅｍｅｎｔ，＼　

ｂｏｏｋｓｔｏｒｅ＼ｓｈｉｐｐｉｎｇ，ＮＵＬＬ）和第７行记录（７，ｓｈｉｐ—　

ｐｉｎｇ，Ｅｌｅｍｅｎｔ，＼ｂ００ｋｓｔｏｒｅ＼ｓｈｉｐｐｉｎｇ，ＮＵＬＬ），通过节　

点的序号进行区分，代表两个不同的ｓｈｉｐｐｉｎｇ节　

点，这两个节点都是根元素ｂｏｏｋｓｔｏｒｅ的子节点，　

故可重构出。通过路径和节点序号可判断节点的　

层次关系，如由表１的第３行和第４行可知，ｓｈｉｐ—　

ＩＤ是根ｂｏｏｋｓｔｏｒｅ的第１个名为ｓｈｉｐｐｉｎｇ的子节　

点的属性，且属性值为ｓ１。同样由表１的第５行　

和第６行可知，ｄｕｒａｔｉｏｎ是根ｂｏｏｋｓ（ｏｒｅ的子节点　

ｓｈｉｐｐｉｎｇ的子节点，其包含的文本节点值为２　

ｄａｙｓ。由上述信息可重构出ＸＭＬ文档片段，如图　

４所示。　

因此，根据Ｄｏｃｕｍｅｎｔ表中记录，顺序读取每　

第３２卷第６期　彭其泽，等：ＸＭＬ文档到关系数据库映射的实现　９３３　

ｄｏｃｕｍｅｎｔｓ　ｕｓｉｎｇ　ｒｅｌａｔｉｏｎａｌ　ｄａｔｂａｓａｅｓ［Ｊ］．ＡＣＭ　Ｔｒａｎｓ—　

ａｃｔｉｏｎｓ　ｏｎ　Ｉｎｔｅｍｅｔ　Ｔｅｃｈｎｏｌｏｇｙ，２００１，１（１）：２１—３２．　

［３］ＹＥ　Ｆ，ＸＩＡＯ　Ｊ　Ｓ．Ｍａｐｐｉｎｇ　ＸＭＬ　ＤＴＤ　ｔｏ　ｒｅｌａｔｉｏｎａｌ　ｓｃｈｅｍａ　

『Ｃ］／／２１３０９　Ｉｎｔｅｍａｔｉｏｎａｌ　Ｗｏｒｋｓｈｏｐ　ｏｎ　Ｄａｔａｂａｓｅ　Ｔｅｃｈｎｏｌ—　

ｏｙ　ｇａｎｄ　Ａｐｐｌｉｃａｔｉｏｎ．Ｗｕｈａｎ：［ｓ．ｎ．］，２００９：５５７—５６０．　

图４重构的ＸＭＬ文档片段　

［４］ＹＥ　Ｆ．Ｃｏｎｖｅｒｔｉｎｇ　ＸＭＬ　ＤＴＤ　ｔｏ　ｄａｔａｂａｓｅ［Ｃ］／／Ｔｈｅ　Ｆｉｒｓｔ　

Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｗｏｒｋｓｈｏｐ　ｏｎ　Ｉｎｔｅｌｌｉｇｅｎｔ　Ｓｙｓｔｅｍｓ　ａｎｄ　Ａｐｐｌｉ－　

个节点的序号、名称、类型、路径和取值信息，可重　

构ＸＭＬ文档。　

ｃａｔｉｏｎｓ．Ｗｕｈａｎ：［ｓ．ｎ．］，２０Ｏ９：２２６７—２２７０．　

［５］　ＦＵＪＩＭＯＴＯ　Ｋ，ＳＨＩＭＩＺＵ　Ｔ，ＹＯＳＨＩＫＡＷＡ　Ｍ，ｅｔ　ａ１．Ａ　

ｍａｐｐｉｎｇ　ｓｃｈｅｍｅ　ｏｆ　ＸＭＬ　ｄｏｃｕｍｅｎｔｓ　ｉｎｔｏ　ｒｅｌａｔｉｏｎａｌ　ｄａ－　

４结论　

ｔａｂａｓｅｓ　ｕｓｉｎｇ　ｓｃｈｅｍａ—ｂａｓｅｄ　ｐａｔｈ　ｉｄｅｎｔｉｉｆｅｒｓ［Ｃ］／／　

Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　２００５　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｗｏｒｋｓｈｏｐ　ｏｎ　

笔者通过解析ＸＭＬ文档，抽取ＸＭＬ文档中　

Ｃｈａｌｌｅｎｇｅｓ　ｉｎ　Ｗｅｂ　Ｉｎｆｏｒｍａｔｉｏｎ　ａｎｄ　Ｉｎｔｅｇｒａｔｉｏｎ（ＷＩＲＩ　

每个节点的名称、类型、路径和取值等信息，并采　

０５）．Ｔｏｋｙｏ：［ｓ．ｎ．］，２００５：８２—９０．　

用二叉树存储。在其后的遍历过程中，将每个节　

［６］ＸＩＮＧ　Ｇ，ＺＨＯＮＧ　Ｘ　Ｈ，ＤＯＵＧＬＡＳ　Ａ．Ｘ２Ｒ：ａ　ｓｙｓｔｅｍ　

点的信息以记录的形式存储在表Ｄｏｃｕｍｅｎｔ之中，　

ｆｏｒ　ｍａｎａｇｉｎｇ　ＸＭＬ　ｄｏｃｕｍｅｎｔｓ　ａｎｄ　ｋｅｙ　ｃｏｎｓｔｒａｉｎｔｓ　ｕ—　

从而实现ＸＭＬ文档到关系数据库的映射，并讨论　

ｓｉｎｇ　ＲＤＢＭＳ『Ｃ］／／Ｐｒｏｃ．ｏｆ　ＡＣＭＳＥ　２００７．Ｗｉｎｓｔｏｎ—　

了由Ｄｏｃｕｍｅｎｔ表重构ＸＭＬ文档的过程。　

Ｓａｌｅｍ：［ｓ．ｎ．］，２００７：２１５—２２０．　

所设计的方法具有如下特点：①映射算法和　

［７］　ＳＯＬＴＡＮ　Ｓ，ＲＡＨＧＯＺＡ　Ｍ．Ａ　ｃｌｕｓｔｅｒｉｎｇ—ｂａｓｅｄ　ｓｃｈｅｍｅ　

存储ＸＭＬ文档的关系Ｄｏｃｕｍｅｎｔ结构简单；②　

ｆ０ｒ　ｌａｂｅｌｉｎｇ　ＸＭＬ　ｔｒｅｅｓ［Ｊ１．Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｊｏｕｒｎａｌ　ｏｆ　ｏＣｍ－　

Ｄｏｃｕｍｅｎｔ表保留了ＸＭＬ文档的数据顺序；③对　

ｐｕｔｅｒ　Ｓｃｉｅｎｃｅ　ａｎｄ　Ｎｅｔｗｏｒｋ　Ｓｅｃｕｒｉｔｙ，２ＯＯ６（６）：８６６—８７３．　

于ＸＭＬ文档中的根、元素、属性和文本等４类节　

［８］ＴＡＴＡＲＩＮＯＶ　Ｔ，ＶＩＧＬＡＳ　Ｓ，ＢＥＹＥＲ　Ｋ，ｅｔ　ａ１．Ｓｔｏｒｉｎｇ　

ａｎｄ　ｑｕｅｒｙｉｎｇ　ｏｒｄｅｒｅｄ　ＸＭＬ　ｕｓｉｎｇ　ａ　ｒｅｌａｔｉｏｎａｌ　ｄａｔｂａａｓｅ　

点在映射中均被有效地存储在Ｄｏｃｕｍｅｎｔ表中，没　

ｓｙｓｔｅｍ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　ＡＣＭ　ＳＩＧＭＯＤ　Ｉｎｔｅｒ－　

有信息丢失；④Ｄｏｃｕｍｅｎｔ表保持ＸＭＬ文档的结　

ｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｍａｎａｇｅｍｅｎｔ　ｏｆ　Ｄａｔａ．Ｍａｄｉｓｏｎ：　

构；⑤由Ｄｏｃｕｍｅｎｔ表可迅速重构ＸＭＬ文档，重构　

［８．ｎ．］，２００２：２０４—２１５．　

算法简单。　

［９］ＤＷＥＩＢ　Ｉ，ＡＷＡＤＩ　Ａ，ＥＬＲＨＭＡＮ　Ｓ　Ｆ，ｅｔ　ａ１．Ｓｃｈｅｍａ－　

ｌｅｓｓ　ａｐｐｒｏａｃｈ　ｏｆ　ｍａｐｐｉｎｇ　ＸＭＬ　ｄｏｃｕｍｅｎｔ　ｉｎｔｏ　ｒｅｌａｔｉｏｎ－　

参考文献：　

ａｌ　ｄａｔａｂａｓｅ［Ｃ］／／２００８　ＩＥＥＥ　８ｔｈ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒ—　

ｅｎｃｅ　ｏｎ　Ｃｏｍｐｕｔｅｒ　ａｎｄ　Ｉｎｆｏｒｍａｔｉｏｎ　Ｔｅｃｈｎｏｌｏｇｙ．Ｓｙｄ—　

ＳＨＡＮＭＵＧＡＳＵＮＤＡＲＡＭ　Ｊ，ＳＨＥＫＩＴＡ　Ｅ，ＫＩＥＲＮＡＮ　Ｊ．　

ｈｅｙ：［ｓ．ｎ．］，２００８：１６７—１７２．　

Ａ　ｇｅｎｅｒａｌ　ｔｅｃｈｎｉｑｕｅｓ　ｆｏｒ　ｑｕｅｒｙｉｎｇ　ＸＭＬ　ｄｏｃｕｍｅｎｔｓ　ｕ—　

［１０］ＺＨＡＯ　Ｑ　Ｊ，ＳＨＵ　Ｍ，ＹＡＮＧ　Ｓ　Ｑ，ｅｔ　ａ１．Ｅｆｉｆｃｉｅｎｔ　ｓｔｏ—　

ｓｉｎｇ　ａ　ｒｅｌａｔｉｏｎａｌ　ｄａｔａｂａｓｅ　ｓｙｓｔｅｍ［Ｊ］．ＳＩＧＭＯＤ　Ｒｅｃｏｒｄ．　

ｒｉｎｇ　ｗｅｌｌ—ｆｏｒｍｅｄ　ＸＭＬ　ｄｏｃｕｍｅｎｔｓ　ｕｓｉｎｇ　ＲＤＢＭＳ　

２００１，３０（３）：２０—２６．　

［Ｃ］／／２００５　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｎ　Ｓｅｒｖｉｃｅｓ　Ｓｙｓ—　

［２］　

ＹＯＳＨＩＫＡＷＡ　Ｍ，ＡＭＡＧＡＳＡ　Ｔ，ＳＨＩＭＵＲＡ　Ｔ．ＸＲｅｌ：ａ　

ｔｅｍｓ　ａｎｄ　Ｓｅｒｖｉｃｅｓ　Ｍａｎａｇｅｍｅｎｔ．Ｃｈｏｎｇｑｉｎｇ：［ｓ．ｎ．］，　

ｐａｔｈ—ｂａｓｅｄ　ａｐｐｒｏａｃｈ　ｔｏ　ｓｔｏｒａｇｅ　ａｎｄ　ｒｅｔｒｉｅｖａｌ　ｏｆ　ＸＭＬ　

２００５：１０７５—１０８０．　

Ｉｍｐｌｅｍｅｎｔ　ｏｆ　Ｍａｐｐｉｎｇ　ＸＭＬ　Ｄｏｃｕｍｅｎ￣ｔｏ　Ｒｅｌａｔｉｏｎａｌ　Ｄａｔａｂａｓｅ　

ＰＥＮＧ　Ｑｉｚｅ，ＹＥ　Ｆｅｎｇ，ＸＩＡＯ　Ｊｉｎｓｈｅｎｇ　

Ａｂｓｔｒａｃｔ：Ｈｏｗ　ｔｏ　ｅｆｆｅｃｔｉｖｅｌｙ　ｓｔｏｒｅ　ａｎｄ　ｑｕｅｒｙ　ＸＭＬ　ｄａｔａ　ｉｓ　ａｎ　ｉｍｐｏｒｔａｎｔ　ｓｕｂｊｅｃｔ　ｏｆ　ｃｕｒｒｅｎｔ　ｒｅｓｅａｒｃｈ．Ａ　ｃｏｍｍｏｎ　ｓｏｌｕｔｉｏｎ　ｉｓ　ｔｏ　ｍａｐ　

ＸＭＬ　ｄｏｃｕｍｅｎｔｓ　ｔｏ　ｒｅｌａｔｉｏｎａｌ　ｄａｔａｂａｓｅ　ａｎｄ　ｍａｎａｇｅ　ｔｈｅ　ＸＭＬ　ｄｏｃｕｍｅｎｔｓ　ｕｓｉｎｇ　ｔｈｅ　ｍａｔｕｒｅ　ｒｅｌａｔｉｏｎａｌ　ｄａｔａｂａｓｅ　ｔｅｃｈｎｏｌｏｇｙ　ｔｏ　ｉｍｐｒｏｖｅ　

ｔｈｅ　ｓｔｏｒａｇｅ　ａｎｄ　ｑｕｅｒｙ　ｅｆｆｉｃｉｅｎｃｙ．Ｓｔｒｕｃｔｕｒｅｄ～ｃｅｎｔｒｉｃ　ｔｅｃｈｎｉｑｕｅ　ｗａｓ　ａｄａｐｔｅｄ　ｔｏ　ｅｘｔｒａｃｔ　ｎｏｄｅ　ｉｆｎｏｒｍａｔｉｏｎ　ｏｆ　ＸＭＬ　ｄｏｃｕｍｅｎｔｓ

．

ｓｕｃｈ　

ａｓ　ｎａｍｅ，ｔｙｐｅ，ｐａｔｈ　ａｎｄ　ｖａｌｕｅ，ａｎｄ　ｓｔｏｒｅｄ　ｔｈｅｓｅ　ｐｉｅｃｅｓ　ｏｆ　ｎｏｄｅ　ｉｆｎｏｒｍａｔｉｏｎ　ｕｓｉｎｇ　ａ　ｂｉｎａｒｙ　ｔｒｅｅ．Ｔｈｅｎ，ｉｎ　ｔｈｅ　ｆｏｌｌｏｗｉｎｇ　ｔｒａｖｅｒｓａｌ　

ｐｒｏｃｅｓｓ，ｅａｃｈ　ｐｉｅｃｅ　ｏｆ　ｎｏｄｅ　ｉｆｎｏｒｍａｔｉｏｎ　ｗａｓ　ｓｔｏｒｅｄ　ｉｎ　ｔｈｅ　ｔａｂｌｅ　ｄｏｃｕｍｅｎｔ　ａｓ　ａ　ｒｅｃｏｒｄ，ｔｈｅｒｅｂｙ　ａｃｈｉｅｖｉｎｇ　ｔｈｅ　ｗｏｒｋ　ｏｆ　ｍａｐｐｉｎｇ　ＸＭＬ　

ｄｏｃｕｍｅｎｔｓ　ｔｏ　ｒｅｌａｔｉｏｎａｌ　ｄａｔａｂａｓｅ．Ｔｈｅ　ｍａｐｐｉｎｇ　ｐｒｏｃｅｓｓ　ｄｏｅｓ　ｎｏｔ　ｒｅｌｙ　ｏｎ　ＸＭＬ　ＤＴＤ　ｏｒ　Ｓｃｈｅｍａ

，

ａｎｄ　ｔｈｅ　ａｌｇｏｒｉｔｈｍ　ｉｓ　ｇｅｎｅｒｉｃ，ｓｉｍｐｌｅ　

ｎａｄ　ｅａｓｙ　ｔｏ　ｉｍｐｌｅｍｅｎｔ．　

Ｋｅｙ　ｗｏｒｄｓ：ＸＭＬ；ｒｅｌａｔｉｏｎａｌ　ｄａｔａｂａｓｅ；ｄａｔａｂａｓｅ　ｍａｐｐｉｎｇ　

ＰＥＮＧ　Ｑｉｚｅ：Ｌｅｃｔ．；Ｓｃｈｏｏｌ　ｏｆ　Ａｕｔｏｍｏｔｉｖｅ　Ｅｎｇｉｎｅｅｒｉｎｇ，ＷＵＴ，Ｗｕｈａｎ　４３００７０，Ｃｈｉｎａ．　

［编辑：王志全］　

本文标签：节点文档属性文本映射

版权声明：本文标题：XML文档到关系数据库映射的实现内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/p/1713540280a639804.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

XML文档到关系数据库映射的实现

更多相关文章

Office小白也能掌握的技巧：Word文档里的方框打钩教程！

Echarts秘籍：打造个性化CPU监控界面，用线图和仪表盘讲述数据故事

家庭网络新手必读：路由器设置全攻略

集体游戏夜不掉线？揭秘如何正确设置家庭网络与路由器！

不再受困：揭秘如何用Adobe Flash Player轻松解密学术文献

告别难题，开启学术新世界：基于SWF、Flash中心及Adobe Flash Player的加密文档解密技巧

快速解决打印机脱机问题，让办公不再受阻！

SWF、Flash玩家的电脑配置选择秘籍

Windows大招：快速掌握创建隐藏文件，让文件安全无痕，一招搞定！

VSCode用户必学：自定义快捷键，实现新建文件夹的智能操作

TP-Link路由器端口映射实战教程，打造个人专属网络空间

救星来了！轻松破解Windows隐藏文件恢复，再也不用担心数据丢失！

优化网络环境：掌握Adobe Flash Player的带宽限制方法

笔记本连无线网怎么都失败？实用攻略来帮你！

IE主页被SWF破坏？恢复教程，快来看看！

释放你的电脑潜能：一招解决Adobe Flash Player中的垃圾问题

从头到尾，全面深度清理电脑上的SWF文件和Adobe Flash Player痕迹

Word控件Spire.Doc 【文本框】教程(3)：如何在 Word 中插入或删除文本框_spire doc 添加 单选框

如何美化桌面图标并使其透明化

掌握192.168.1.1：家庭网络中的基础配置与管理

发表评论

推荐文章

Win10回收站卡死难题：如何处理1万个文件的怪圈

破解金山毒霸，让Flash中心和Adobe Flash Player自由翱翔

如何将笔记本设置成无线路由

终端terminal个性化配置_linux terminal颜色

K30手机无法配合电脑？别急，这里有实用解决步骤！

热门文章

无法运行SWF文件？揭秘内部服务器500错误的真相

系统卷信息太乱？快速学会清理的正确姿势

电脑死机原因解析

从Windows到手机：一步步教你查询IP地址_手机, 命令行ip查询

windows加linux双系统安装方法_win7uefi模式和麒麟双系统安装

怎么更改电脑的护眼色_电脑护眼色

js字体溢出字体变小_可变字体：它们是什么，以及如何使用它们

易Recovery：助你迅速解决数据丢失问题的神器

IP地址192.168.2.168：在局域网里的角色与用法

解决192.168.1.1访问问题，让你畅行无阻！

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑

Word控件Spire.Doc 【文本框】教程(3)：如何在 Word 中插入或删除文本框_spire doc 添加单选框