admin 管理员组文章数量: 1086019
2024年5月1日发(作者:编程包括什么)
11 绒l IT Running and Maintenance l
借助第三方工具构建高可用的IM¥数据库系统
中国建设银行股份有限公司北京数据中心孙锋
核心业务系统(CCBS)是中国建设银行(以下简
称“建行”)以客户为中心、本外币一体化的会计核算
整合交易系统。2005年9月,建行顺利完成了38家分
行的数据集中工作,该系统承担了全行百分之九十以上
的日常业务交易处理,它实现了全行会计核算和核心银
行业务的集中统一及全行范围内的通存通兑,不仅加快
了资金清算速度,提高了会计核算质量,统一了业务和
数据标准,而且实现了客户信息的共享,保障了核心业
务及账务的稳定正确处理。
作为建行核心业务系统的数据和信息载体,IMS数
据库系统发挥着非常重要的作用。建行IT信息技术管
理已上升到企业级、战略性的高度,如何构建、维护高
效而稳定的IMS数据库系统,从而支持核心业务系统稳
定高效运行,成为数据库管理员(DBA)目前最重要的
工作之一,而这其中最大的挑战来自业务部门的7 X 24
4,a,1不间断运行的可用性要求。本文从不同方面对IMS
数据库的可用性管理进行探讨,以最大程度地满足业务
部门的需求。
1.数据库系统高可用性的定义
高可用性通常是描述一个系统经专门的设计后可以
减少停顿时间,保持其服务的可用性,一般定义为系统
保持正常运行时间的百分比。在建行IMS数据库管理过
程中,我们主要关注四个方面:可靠性、可管理性、可
恢复性和可维护性。其中,可靠性是指通过良好的数据
库体系设计规避系统运行风险,如使用IMS多路数据共
享机制预防单点故障来提高可靠性;可管理性是指通过
多种管理手段和流程(如通过开发、测试、准生产环境
的严格变更管理和监控流程)来保障IMS数据库系统正
常运行;可恢复性是指在异常状态下保持完整一致的数
据库备份的能力,主要通过日常的数据备份和恢复流程
来提升;可维护性是指在发生问题时快速分析、诊断、
规避和解决问题的能力。
下面将着重从数据库维护、配合应用版本投产进行
数据变更而造成的计划停机时间,以及在非计划停机时
间段内迅速恢复生产这三个方面来探讨如何提高数据库
系统的高可用性。
2.计划停机时间的规避和减少
目前,建行IMS数据库的计划停机时间主要源于对
IMS数据库本身的维护、数据库维护和应用要求的数据
结构的变更。目前,使用Sysplex各成员滚动实施的方式
完成对IMS系统本身的维护(如补丁、版本升级等),减
少了对核心业务系统的影响。但是,我们面临更多的是
数据库结构的变化、日常维护而引起的数据库系统不可
用。常见的数据运维操作和可用性影响分析如表l所示。
从表1可以看出,为减少或规避数据运维和结构变
更有关的计划停机时间,主要的思路是:将目前数据库
系统自身不能通过联机完成的工作,使用第三方工具对
标准IMS功能进行扩展或借助其专有功能,从而规避计
划停机时间;对目前不能联机完成的数据结构变更或缺
乏对应的专业第三方工具的情形,借助高效率的数据库
工具,减少作业运行时间和计划停机窗口。将这两种方
法结合,可以显著地减少计划内停机时间,可以有效地
提高IMS系统的可用性。
以分行活期主档增加分区数的变更为例,说明如何
减少停机时间、提高IMS的可用性。为满足建行业务的
快速发展,需要及时对分行的活期主档增加分区数来提
高数据库的容量。按照现有CCBS系统的应用架构设计,
当新增分行活期主档的分区数目变更时,需要同时对该
2011 1,中国金融电脑 63
表1 数据运维操作和可用性影响分析
维护类型
运维
操作 标准维护流程 IMS可用性影响 可用性提升对应措施
数据库备份 联机或脱机 和IMS系统竞争 使用第三方专业工具Image Copy Plus,用上一代IC和归档的
资源 IMS日志来生成新一代备份,尽量减少对联机数据库的影响
联机或脱机 和联机业务争夺 采用第三方专业工具Fast Path Enhanced Online Suite,联
资源和日志量 机快速完成数据库重组,减少IMS日志量,减少竞争时段
运维 DEDB数据库重组
Fu11 Funetion/HALDB
运维 重组 脱机
被重组数据库不 使用第三方工具MAXM Reorg Online的联机重组功能,减少数
可用 据库停止时段到分钟级别,或使用其内置单步重组功能快速完
成脱机重组
源系统数据备份 使用第三方工具Backup&Recovery Solution for IMS建立
时对象数据库不 生产数据PIT备份,在目标系统中恢复,可以在生产系统中联
可用 机完成
运维 数据迁移(不同系统间) 脱机
运维
数据库空间预警和增长
趋势分析 联机
和联机业务争夺 目前,第三方工具可以在维护时同步收集数据库状态信息,汇
资源 总后进行预警和趋势分析。未来可考虑引入第三方专业管理工
具进一步提升这方面的效果
和联机业务争夺 使用第三方工具Pointer Checker Plus在数据备份同时进行
资源 指针检查,避免和联机争夺资源:或快速完成指针检查功能减
少竞争时段
运维 数据一敛性检查
应用PSB相关的变更,包
括新增
删除、源代码的
修改
、
联机
变更
联机
在变更过程中目 使用第三方工具D
elta Plus for DBCTL同步在多IMS成员间
标应用不可访问 变更
该PSB 加快变更速度,建立版本基线,加强版本管理
,
变更 新增数据库/删除数据库 联机 变更对象关联的 使用第三方工具
应用不可用
,
加快数据库备份或加载速度,减少处理时间
变更
某些数据库DEDB变更,
如
Segment长度不变,
某些字段变更
DEDB新增AREA
联机
脱机
变更对象关联的 可以通过联机数据转换完成联机处理数据的
应用不可用 三方工具提升变更效率
。
未来考虑使用第
变更 变更对象数据库 使用第三方工具Fast Path Onl ine Restructure减少数据库
不可用 停顿时间
DEDB结构变更,包括
变更 CISIZE、空间大小,DEDB
SOURCE变更
变更 DEDB RANDOMIZER变更
脱机
脱机
变更对象数据库 使用第三方工具Fast Path Online Restructure减少数据库
不可用 停顿时间
变更对象数据库 使用第三方工具Fast Path Onl ine Restructure减少数据库
不可用 停顿时间
变更 HALDB Full Function数
据库新增次索引
变更 HALDB拆分
partitiOn
脱机 变更对象数据库 使用使用第三方工具Secondary Index Build加快索引建立速
不可用 度,减少数据库停顿时间
变更对象数据库 使用第三方工具MAXM Reorg On1 ine加快分区下载和上载时间,
不可用 减少数据库停顿时间
变更对象数据库 使用第三方工具MAXM Reorg Online加快分区下载和上载时间,
不可用 减少数据库停顿时间
变更对象数据库 使用第三方工具MAXM Reorg Onl ine加快分区下载和上载时间,
不可用 减少数据库停顿时间
脱机
变更 HALDB新增
变更
partition 脱机
脱机 H A L D B p a r t i t i 0 n
KEYSTRING变更
数据库类型变更,如从
变更 Ful1 Function到HALDB
或DEDB数据库的转变
脱机
变更对象数据库 使用第三方工具MAXM R eorg On1i ne高速完成从Full
不可用 Functi 0n到HALDB类型转变,使用第三方工具Fa st Path
Enhanced Online Suite高速完成到DEDB数据类型的转换
64 FINANcIAL c。MPuTER 0F CHINA
,7 唇维l IT Running and Maintenance I
分行的活期历史档、活期扩展档和税档等三个数据库进
数据库变更管理工具可以有效地简化变更步骤,也控制
行联动增加相同数量的分区数。目前,变更大致分为以 了操作风险和变更风险。
下八个步骤:停止数据库系统;进行数据库记录下载;
更新数据库结构以及对应的注册信息;定义数据库物理
3.预防非计划性停机
通常,IMS数据库异常终止难以预测,这就需要我
存储文件;进行数据库记录加载;核对变更前后的记录
们通过更细致、完整的工作做好数据库维护管理流程,
条数;数据库的0级备份;启动数据库系统。整个变更
如版本的更新、及时安装补丁、提供对厂商重大补丁的
完成大约需要4.5小时,而且只能安排在计划内停机维
紧急维护等,借此提高数据库系统的可管理性,并通过
护窗口内完成,变更的压力非常大,而且严重地影响了 数据库及时有效备份来提升可恢复性。加强和细化IM S
数据库系统的高可用性。
数据库系统运行监控,实现主动预警,防止故障的发生。
结合第三方工具,建行开发了一套数据库容量管理 通过研究和测试发现,可以借助DEDB数据库变更
nter
管理的工具,来帮助我们进行此类变更。数据库变更管
工具,使用自己编写的REXX程序,读取每周Poi
Plus数据现状分析报告,分析数据库容量的增
理工具可以联机进行变更或有效地缩短计划内停机的窗
Checker
口时间,提高数据库系统的高可用性。其主要工作原理
长趋势,主动预防因容量不够而产生的运行异常。另外,
是,另外建立一个当前数据库的副本进行数据结构的变 在数据库空间不足的紧急情况下,使用第三方专业工具
更,使用数据库重组的方式将数据迁移到新的数据库中, (Fast Path Enhanced Online Suite)联机对数据库空间进
同时使用专门数据库变更捕获技术,将迁移周期中发生
行扩容来提高数据库的可用性。2010年,建行曾三次使
的数据变更也更新到新数据库中。最后,停止源数据库,
进行数据集的切换,更新数据库注册和恢复信息,重启
用联机动态扩展(Online Extend)的功能,动态对数据
库进行了扩容,避免了三次运行事故的发生。
出现问题时,银行最关注的是快速恢复和问题定位
新的数据库使其生效,逻辑示意见图1。
在整个变更过程中,只有最后的切换过程需停止数
诊断,这涉及很多工作,主要取决于对现有系统和环境
据库,其他时间数据库一直可以正常使用。测试结果显
的熟悉,以及产品知识和处理经验。这方面的能力需结
示,只要l小时的停机时间就可以完成增加分区数等操 合日常的工作,长期逐步培养和加强。“工欲善其事,必
作,大大减少了数据库计划停止时间。同时,由于使用 先利其器”,构建高可用的IMS数据系统是银行科技工
作追求的运行目标,在实
现这一目标的过程中,数
建立变更计划数据l
使用准备阶段的
使用准备阶段的变更计划对机构
集,包括数据库的l
变更计划初始化 进行变化,源分区继续可用:
影子数据库数据
f续处理输入,验证f
集,如需要可以
变更类型,如有BNC
使用参数建立主
Fa St pat h 0n1 i n e
/次两套影子数
Ana1 Yz er分析工具,
据库,次拷贝可
l同步对DEDB数据集
以用作备份或回
I进行指针检查 l
复用途
变更信息,建立后 分区拷贝,根据变更要求从源分
区中拷贝所有数据到影子数据库
中,并进行机构变化。每个分区
起一个IFP作业来完成上述拷贝,
多个IFP可并行处理;
在拷贝同时捕获对源数据分区的
任何变更;
将变更追加剑影子数据库中
停止源数据库
或分区,切换
源和影子数据
库, 更改DBRc
中的信息,重
新力口载ACB 口
rand0Illi z er s,
据库工具发挥着非常重
要的作用。严格执行定义
的标准流程,使用合适的
工具,发挥数据库管理员
的主观能动性,是进一步
J
启动数据库,新
数据结构的数据
库可用
提升IMS数据库运维水
平的关键。圆
图1数据库变更逻辑示意
2011 1/中国金融电脑 65
版权声明:本文标题:借助第三方工具构建高可用的IMS数据库系统 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1714511086a683194.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论