admin 管理员组文章数量: 1086019
2024年4月20日发(作者:js代码混淆还原)
科技资讯
2008NO.13
SCIENCE&TECHNOLOGYINFORMATION
IT技术
基于
XML
的异构
河南郑州450002;
数据库信息集成模型研究
徐进
1
马欢
2
2.郑州轻工业学院计算机与通讯工程学院河南郑州450002)(1.郑州轻工业学院
摘要:本文在对传统的异构数据集成方案进行广泛的调查总结分析的基础上,提出了一种集成异构数据库信息的共享框架,该框架包括
翻译器、集成器和转换器;翻译器将关系数据发布为XML文档,集成器和转换器来提供异构关系数据库的XML全局视图,允许外部用户
直接访问或使用XML查询语言查询这些视图。
关键词:XML异构数据库查询
中图分类号:TP319文献标识码:A文章编号:1672-3791(2008)05(a)-0104-02
随着网络的发展,特别是在信息化时1.4数据库层
代和全球经济竞争的新环境下,数据资源处于最底层,是系统的数据提供者,分
的共享己经成为一个热门并且需要解决的布于各个需要集成的异构数据库。
问题。基于XML的数据集成中间件就是解
决信息孤岛问题的一种很好的方法。本文
2模型分析
利用XML和中间件技术,提出一种基于本集成模型与包装器/调节器模型的
XML和中间件的数据集成方案。通过该中类似之处在于:l)翻译器类似于包装器,两
间件,可将各种异构数据库集成在一起,并者实现对底层数据库的包装,为用户提供
为高层提供一个统一的访问服务接口。透明访问;2)对应于调节器,本模型提供了
转换器和集成器,都实现对包装翻译过的
1数据集成框架模型
信息的进一步集成。不同之处在于:l)包装
在进行集成分析和设计时可以把各个器/调节器模型中包装器与数据库需要一
应用系统作为一个单独的应用模块加以考一对应,而本共享模型只需要实现一个统
虑。本文在对XML技术进行分析探讨的基一的翻译器;2)包装器需与调节器一一对
础上,设计了以下模型,如图1所示。应,因此不利于系统扩展。而本共享模型,
增加一个数据源。不必重新实现翻译器、
转换器和集成器,只需提供数据源的连接
信息和翻译、转换、集成的必要信息;3)对
于用户查询,调节器将查询请求分解为包
装器可以执行的小查询,派发给包装器,并
组合查询结果。在本模型下,用户查询直
接在统一视图上进行,不需要分解派发。
3功能模块组成
集成模型在任意多个异构数据库上面
构造了一层XML全局视图,即将数据库的
数据翻译成XML文档,并经过转换集成,
成为统一模式的视图。
共享模型由三个基本部分组成:
1)翻译器:将数据库数据翻译成XML
文档,需要建立映射语言规范以表示翻译
规则。
2)转换器和集成器:将源XML文档进
图1
行的转换和集成,形成其它模式XML文
档。
该模型由以下四层组成:
3)查询接口:采用支持Xquery查询语
1.1客户端层
言的Xquery查询软件(如XMLQueryEn-
用户交互界面,接受用户的信息请求
gine等)。
并返回请求结果。
本模型首先建立一种映射语言规范,
1.2Web层
通过定义一个符合映射语言规范的映射文
为企业提供Web服务,包括信息的发
件,翻译器可以将数据库模式准确地翻译
布、交互和处理的功能。只存在于基于
成XML模式。因此,实现异构数据库到
Web的分布式企业信息系统中。
XML的翻译功能需要做两个工作:定义映
1.3业务层
射语言规范和实现翻译器。
数据集成中间件封装了系统的业务逻
翻译器将异构数据库的数据翻译成
辑,提供集成的业务服务,构成系统的业务
XML文档后,这些文档在逻辑、格式可能
层。接收客户端的查询请求,接收来自数
还存在一定的差别,需要通过一系列XML
据库的源数据格式的查询结果,并将其转
转换来统一模式。转换器通过应用Xslt样
化为XML文档。合成的XML文档经语法
式表执行该转换功能。
分析、处理,协同XSL,依据客户端要求的
翻译器和转换器执行结果的XML文
文件格式返回。
档,需要进行进一步提取或合并,以满足更
104
科技资讯SCIENCE&TECHNOLOGYINFORMATION
为复杂的需求。集成器采用原始的Xquery
语言对源XML文档进行查询提取,再通过
DOM技术把查询出来的XML片断组织成
新的XML文档。
通过翻译器、转换器和集成器的使
用,异构数据库的XML全局视图便建立起
来。接下来,便是定义和管理视图。
翻译器、转换器和集成器的输出都是
格式完好的XML文档。翻译器可以独自定
义为一个视图,也可以作为转换器和集成
器的输入。因此,一个视图可能需要多个
组件的配合使用,也可能由单独的一个翻
译器定义。
4技术实现
使用XML文档作为中间文件实现异构
数据库间信息转换的方法,可以归结为以
下几个步骤:
4.1访问数据库
通过目前多种软件开发平台提供的数
据库互连接口和数据库访问技术,如
JDBC、ODBC、ADO、DAO、COM等,可
以轻松地访问数据库文件,并导出结果集
(ResultSet)。
4.2生成XML文档
为了将得到的结果集封装成XML格
式,本文利用DOM4J开源技术,基于Java
平台来编码。
//创建XML文档对象xmldoc
ntFactorydf=new
ntFacto-ry();
Documentxmldoc=Document
();
//创建根节点
Elementroot=ment
“(AASet”);
//访问每条纪录
While(())
{ResultSetMetaDatarsmd=rs.
getMetaData();
ElementparentEle=ment
(“AA”);
//访问该条纪录的所有字段
for(i=1;i<=umnCount();
i++)
{ElementchildEle=parentEle.
addElement(umnLa-bel(i));
t(ect(rsmd.
getColumnLabel(i)));}}
//写文件
(下转106页)
科技资讯
2008NO.13
SCIENCE&TECHNOLOGYINFORMATION
图1基于神经网络的模式识别框图
图2基于神经网络的模拟电路故障诊断方法框图
我们可以从周围的世界接收到数据,通过练过的神经网络能存储有关过程的知识,
学习过程来成功的实现模式识别的,神经能直接从定量的、历史故障信急中学习。
网络也是如此。识别模式(并以认识为基可以根据对象的正常历史数据训练网络,
础产生动作)是所有生物系统共有的主要然后将此信急与当前测试数据进行比较,
活动。一个过程,通过这个过程将接收的以确定故障。(2)人工神经网络具有滤除噪
模式或信号确定为一些指定类别中的一声及在有噪声情况下得出正确结论的能
种。训练数据中提取的信急识别特定模式力,可以训练人工神经网络来识别故障信
的类别。并识别出数据源。判定边界由训急,使其能在噪声环境中有效的工作,这种
练过程决定。可以根据各个模式内部以及滤除噪声的能力使得人工神经网络适合在
已们之间固有的可变性,用统计方式确定线故障检测和诊断。(3)人工神经网络具有
边界。采用神经网络的模式识别如图1所分辨故障原因及故障类型的能力。
示:4.2基于神经网络的模拟电路故障诊断方法
如图1所示,识别分为两部分:用来做电路中硬故障约占电路故障率的80%,
特征提取的无导师网络和做分类的有导师其中50~60%是R开路、C短路和晶体管
网络。这种方法遵循传统的统计特性模式开路或短路。本文讨论直流工作状态下的
识别方法。通过有导师学习算法的多层前硬故障情况,下面对基于神经网络的模拟
馈网络进行分类。在这个方法中,特征提电路故障诊断进行介绍。基于神经网络的
取由网络隐含层中计算单元执行。对于故模拟电路故障诊断方法是SBT及SAT方法
障诊断而言,其核心技术是模式识别,即根的综合和延伸,其结构框图如图2所示:
据测试数据对故障进行分类从而达到故障对图2中各部分功能阐述如下:(1)训
定位的目的。练样本集:在电路的各种状态下,用仿真软
神经网络之所以可以成功应用于故障件测量测试点在选定激励下的数据,获取
诊断领域,主要基于以下3方面原因:(1)训测试信号。经过数据预处理及特征提取
104页)
指定的数据库中,必须读取每个元素的所
OutputFormatof=OutputFormat.
有结点值,然后把提取的数据通过数据库
createCompactFormat();
访问技术写回到数据库中,部分代码如下:
oding(“gb2312”);
treeWalk(tElement());
XMLWriteroutput=newXMLWriter
//得到根结点,从根结点开始遍历
(tput-Stream(newFile
Stringquery=”InsertInto”;
(“c:/”)),of);
publicvoidtreeWalk(Elementelement)
(xmldoc);
{
();
for(inti=1,size=unt();
4.3查询XML文档
i<=sizNodenode=(i);
XQuery查询系统的查询过程如图2。
if(nodeinstanceofElement){
treeWalk((Element)node);}
else{
query=query+leName(i)+”
Value(“+Value()+”,”);}
query=qurey+”)”;}
eUpdate(query);}
//数据库连接省略
5结语
用XML作为数据交换的中介,给系统
图2
的实现带来很大的灵活性。系统可屏蔽掉
后台的多种数据源,用统一的XML文档表
4.4写回结果
示数据。应用程序可以通过DOM对XML
要将查询结果进行加工处理并返回到
文档进行处理操作,且不同的显示形式呈
106
科技资讯SCIENCE&TECHNOLOGYINFORMATION
IT技术
后,与对应的元件故障类构成神经网络的
输入-输出序列,从而实现样本集的构造。
(2)特征提取:故障特征是对电路故障症状
信息进行变换,所得到的最能反映故障模
式分类的本质特征。
4.3神经网络模型参数的选择
参数选择主要包含以下三方面内容:
(1)网络模型的选择:主要包括确定激活函
数、连接方式、各神经元的相互作用等。(2)
网络参数的选择:确定输入、输出神经元
的数目,多层网络的层数和隐含层神经元
的数目的选择。(3)学习训练算法的选择:确
定网络学习训练时的学习规则及改进学习
规则。在训练时还要结合具体的算法,考
虑初始化的问题。(4)所提取的故障特征经
过数据预处理及特征提取,形成待诊断样
本集。(5)诊断结果:将故障特征向量输入经
过训练的神经网络,得到故障诊断结果,即
可判别电路元件的故障类型。
参考文献
[1]梁戈超,何怡刚,朱彦卿.基于模糊神经
网络融合遗传算法的模拟电路故障诊
断法[J].电路与系统学报,2005(2):54~
57.
[2]夏克文,李昌彪,沈钧毅.前向神经网络
隐含层节点数的最优算法[J].计算机科
学,2007(10).
[3]袁慧梅,李锦萍.模拟电路故障诊断新方
法[J].航空精密制造技术,2006(2).
[4]樊锐,刘强.基于人工神经网络的电路故
障诊断专家系统[J].系统工程与电子技
术,2006(10).
[5]罗先觉,邱关源.模拟电路单一故障的模
糊神经网络诊断方法[J].系统工程与电
子技术,2007(6).
现给用户。以XML为载体进行数据交换,
已成为数据管理模式的发展趋势,日益成
为下一代WEB的基础。
参考文献
[1]曾小宁,黎明.基于XML的数据交换中
间件的研究与实现[J].计算机工程与设
计,2007(12).
[2]孙海军,高岩.基于XML的异构数据库
集成技术的研究[J].电脑知识与技术
(学术交流),2007(09).
[3]张凯,徐苏,田长根.基于XML的异构数
据库集成中间件系统研究[J].计算机与
现代化,2007(02).
[4]李爱华,陶宏才.计算机与现代化[J].一
种基于XML的数据集成中间件系统方
案,2007(06).
(上接
版权声明:本文标题:基于XML的异构数据库信息集成模型研究 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1713560217a640770.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论