英方与金湖农商行共同打造的业务连续性解决方案,实现了数据下发和事后监督两大核心系统的本地持续数据保护和应用的高可用,让金湖农商行在信息化浪潮中对数据的安全和业务连续有足够强大的支撑,达到灾备建设一箭双发的效果。
——万军
金湖农商行信息科技部总经理
行业背景
服务“三农”,实现农业增收、农民富裕一直是农村地区金融机构的主要职责。然而,随着经济的高质量快速发展,在经济比较发达、城乡一体化程度较高的地区,“三农”的概念已经发生很大的变化,农业比重很低,有些只占5%以下,作为信用社服务对象的农民,虽然身份没有变化,但大都已不再从事以传统种养耕作为主的农业生产和劳动,对支农服务的要求较少,信用社实际也已经实行商业化经营。对这些地区的信用社,可以实行股份制改造,组建农村商业银行。
金湖农商行官网http://www.jhnsyh.com
农村商业银行是由辖内农民、农村工商户、企业法人和其他经济组织共同入股组成的股份制的地方性金融机构。各农村商业银行一般由农村信用社股改而来,省级内所有农商行一般由省农信社管理,比如江苏省农信社下设60家农商行,县级农商行所有交易系统和交易信息统一由省农信社托管,银行客户在农商行网点的所有交易直接通过专线到达省农信社。省联社采用t+1的模式,通过数据下发系统将数据下发至各家法人单位。
目前有很大一部分农商行顺应国家节能减排号召以及信息化发展趋势,在本地机房建立起虚拟化平台,将之前运行在物理单机之上的应用系统迁移到虚拟化平台,保障服务器资源的最大化利用,同时可以为应用系统动态横向扩展,简化了IT运维的复杂度。
目前,在全省农商行信息化建设取得阶段性成果之后,农商行的信息数据安全和业务连续摆在突出位置。根据《中国人民银行关于银行业金融机构信息系统安全等级保护定级的指引意见》(银发〔2012〕163号)4.1.1.5章节有关数据安全及备份的要求,农商行需要对重要信息进行备份与恢复,确保核心数据不丢,业务不停。
用户现状
江苏金湖农村商业银行股份有限公司(简称:金湖农商行)的信息化建设主要服务于本行,覆盖到直辖内的所有营业厅,农商行总行一般包括以下信息系统:
考试系统、身份通、合规管理、审计系统、对账系统、OA系统、信贷无纸化系统、现金流通系统、数据下发系统等。
农商行银行内使用比较广泛的是IBM的DB2数据库。金湖农商行积极响应信息化建设中节能减排的要求,机房信息化主要采用虚拟化平台,通过资源集中管理,有效避免机房内系统重复建设。前端应用服务器通过采用VMware虚拟化平台,后端采用1到N台磁盘阵列用于数据的保存,主要架构有双机单柜、双机双柜等。
目前金湖农商行需要保护的核心系统主要有:
1)事后监督系统:通过对业务凭证的影像扫描、影像处理、OCR识别、人工处理、重点监督的处理过程,通过自动识别与人工录入相结合的方式,在完成流水监督、重点交易凭证和流水的重点审查的同时,建立了凭证影像的精确索引,实现了电子化档案规范化管理,方便档案的查询。
2)数据下发系统:接受的本银行交易数据,其他很大一部分系统需要依靠本系统的数据。
用户需求
目前,金湖农商行针对IT系统采用手工保护机制或者传统定时数据保护软件,每天定时备份数据,但遇到问题主要集中在以下几个方面:
1)虚拟机系统错误:虚拟化平台内的业务系统一旦VMDK文件发生逻辑错误,虚拟化平台无法保证应用系统的访问。
2)系统硬件宕机:应用系统所在服务器发生故障,传统保护方式需要恢复操作系统到新的服务器,消耗大量时间,并且存在恢复是否成功的不确定性,严重影响了农商行业务对外的连续性。
3)数据丢失:一旦银行应用数据库所在存储发生损坏造成银行系统核心数据丢失,势必影响银行内部工作的运行,影响银行的信誉,甚至造成严重的经济损失。
4)影像保护:随着业务量的不断增加,产生了大量的影像资料,传统的备份软件需要消耗大量时间备份影像,并且在发生影像丢失后,需要恢复数据到生产环节,传统的保护方式已经无法满足银行针对影像系统安全保护的需求。
针对以上突出问题,客户要求提供一个改进灾难恢复和高可用性的计划,即通过灾备软件实现相关数据的保护,利用服务器上的备份软件通过IP网络实现数据的远程复制,对应用及数据进行容灾备份,确保数据零丢失,服务不停。我们概括地将其要求如下:
1)数据的实时复制:本地生产系统在写入生产端的同时,于秒级内同步到灾备端,以便生产端系统数据损坏丢失后,可以通过灾备端恢复数据。
2)应用的高可用:一旦生产端DB2核心系统宕机,机房维护人员在确认生产端宕机且双机都无法启动后,可以在短时间以内将系统切换到灾备机房的业务系统备机,并对外提供服务、保障系统7X24小时运行。
3)恢复历史数据库及文件:如果当前最新数据库及文件损坏,可以通过CDP技术将数据库及文件恢复到历史的正确的一致的状态,启动成功,并提供对外服务。
业务连续解决方案
英方工程师根据用户机房的信息化建设情况(数据下发系统(Suse+DB2)和事后监督系统采用单机模式),通过在本地机房部署一台灾备一体机,并在i2Box上安装虚拟化操作系统,创建与数据下发系统对应的虚拟机,同时安装Suse操作系统和DB2数据库和事后监督系统对应的虚拟机。目的主要是用于本地数据下发和事后监督系统的高可用切换及CDP保护,保障系统的安全性,实现当生产系统发生宕机或者数据丢失时,灾备系统能够提供细粒度恢复有效数据,保障应用系统快速恢复上线,对外提供访问服务。
如上逻辑容灾拓扑图方案,在每个需要保护的客户端安装英方灾备软件,针对相关数据/应用实施实时保护,在生产机和i2Box之间实现数据实时同步和CDP持续数据保护。具体说明如下:
i2COOPY过程:生产机通过i2COOPY实时异步复制数据到本地i2Box,再通过英方基于窄带宽传输技术实现本地灾备数据到异地灾备机i2Box的同步(包括非结构化数据和结构化数据)。
i2CDP过程:通过开启CDP配合灾备系统记录每个IO,如DB2服务器异常终止后,首先通过i2COOPY恢复数据,再配合CDP功能完成数据的细粒度、历史性记录恢复。
i2Availability过程:英方软件检测到生产端发生异常造成数据或服务无法访问,当心跳时间超出预先设置的时间仍无法访问后,英方软件控制台发出指令要求灾备机接管,此时底层数据已经通过i2COOPY从生产机传输到灾备机,灾备机启动数据库,并且使用生产机飘移过来的IP地址对外服务。
本案中,所有的配置和监控可通过灾备控制机实现,通过WEB的方式实现灾备的配置、流量监控、数据恢复等。控制机可以是灾备端任一台服务器,其上安装英方灾备控制机模块,并保证该服务器必须和所有被管理的服务器可联通。
方案启示
如果根据本案的用户生产环境和灾备需求,从传统的灾备规划建设思路出发,要想在本地机房实现数据的CDP保护和实时快速应用切换,价格昂贵。英方在金湖农商行相关技术人员的协助下,为银行数据下发和事后监督系统设计的连续性解决方案,不仅能够很好地解决投入过大的难题,还取得了性能稳定、安全运营的效果,并且后期高质量的运维服务以及科学的项目管理,都可以在金湖农商行后期其他核心系统在灾备建设时提供非常有价值的参考,为国产灾备软件在打造全省农商行信息化灾备保护领域建起了可供参考和快速复制的模板。
推荐阅读: