近来,新冠疫情此起彼伏,大规模的核酸检测与健康码检查,造成多地健康码系统出现异常情况,给各地的疫情防控工作带来严峻挑战,也给健康码背后的运行系统带来巨大压力。
负载过大宕机/内存溢出都会给健康码系统带来影响,严重的生产设备软硬件出现故障,更会造成健康码长时间无法使用,给人们的出行带来困扰。
如何给健康码系统多一份保护,英方软件根据自身的科创技术优势,针对健康码系统的部署环境,推出了“硬核”容灾解决方案,确保健康码系统在生产系统不可用(如设备故障)时,能够将服务快速切换到灾备端,可在省级政务云两地三中心、医疗健康系统容灾等场景使用。
01健康码容灾系统方案概览
健康码系统涉及到健康信息大数据服务内容,不仅前端会有各种应用数据,后端也会通过调用防疫健康数据、卫健委数据、交通数据、出入境数据、电信数据等等。那么,在给健康码系统多一份保护的情况下,英方通过动态文件字节级复制技术,在远距离做到数据不丢失情况下,可快速启用灾备中心接管系统,继续为公众提供健康码服务。
(1)正常状态下
政务云生产中心服务器向用户提供健康码服务,英方容灾系统将自动建立一条实时复制规则,将数据实时同步到灾备中心备用服务器。
(2)生产中心故障
政务云生产中心服务器发生宕机故障,灾备中心备用服务器应用接管并向公众提供健康码服务。
(3)生产中心故障修复
政务云生产中心服务器故障修复开机启用,通过英方产品反向同步数据,此阶段灾备中心服务器继续向公众提供健康码服务。
(4)业务回切
反向数据同步完毕后,业务进行回切,由生产中心服务器接管应用并向公众提供健康码服务,切回正向数据实时同步。
整个方案过程逻辑清晰,安全稳定,可在健康码系统发生故障时,在最短时间内接管服务,为公众提供健康码服务。
02政务云两地三中心实践分享
某省政务云主生产中心作为政府部门核心业务系统运行主节点,一旦发生灾难,核心数据丢失,将造成整个业务系统的瘫痪。其疫情防控一体化平台,不仅为战斗在一线的卫生健康监督员和疾控人员提供了防疫战疫的行动指南,也为各级卫生健康监督机构依法有效开展新冠肺炎防控卫生健康监督工作提供极大便利。根据其重要性,英方软件携手合作伙伴,为其规划建设了两地三中心容灾架构的方案。
在省会A城市建设同城容灾中心,通过合作伙伴为部分关键型应用提供“数据零丢失”的应用级容灾/双活能力。在异地建设异地灾备中心,英方为部分关键型应用提供异地的应用级容灾能力。
同时,基于省大数据局的生产中心和异地灾备中心,建设业务数据的本地+异地备份能力。
△两地三中心容灾方案
方案根据业务数据备份需求分析,及灾备国标建设标准 GB/T20988-2007 《信息安全技术 信息系统灾难恢复规范》,数据备份系统参照灾难备份等级三级标准建设数据备份系统,两地三中心应用容灾架构实现如下目标及功能:
(1)同城业务级双活:关键业务系统如健康码系统,可满足同城双中心同时提供服务的能力,灾难发生后业务恢复时间 RTO<10 分钟,灾难发生后数据丢失时间 RPO=0。
(2)同城业务级容灾:关键业务系统如健康码系统,可满足同城双中心实现业务主备容灾能力,灾难发生后业务恢复时间 RTO<1 小时,灾难发生后数据丢失时间 RPO≈0。
(3)异地业务级容灾:关键业务系统如健康码系统,可满足进行异地业务级容灾能力,灾难发生后业务恢复时间 RTO 小时级,灾难发生后数据丢失时间 RPO >=10分钟。
(4)本地数据备份:在主中心实现本地实时备份,对业务数据(结构化数据库、非结构化文档)进行持续数据保护(i2CDP),以便于在数据损坏时候能够恢复到备份的数据副本。
(5)异地数据备份:在异地灾备中心实现异地备份,实时对业务数据进行备份,以便于在数据损坏时候能够恢复到备份的数据副本。
△总体两地三中心灾备架构
如上图整体架构所示,灾备方案建设基于两地三中心架构政务云平台,主数据中心、同城中心可承载重要核心系统的双活业务,支撑业务的连续性,同城中心也可作为主中心的容灾站点,支撑重要业务在两中心的快速切换。异地中心作为灾备站点,可满足业务的异地备份副本保存需求,保障备份数据在异地的多一份副本。
针对政务外网的资源的需求,在生产中心和同城中心分为互联网区和公用网络区两朵云。每一个云平台的云管平台可管理生产中心和同城中心两个资源区,云服务器、裸金属服务器和配套的云服务发放和运维均在统一云管平台完成。统一架构的云平台可在生产中心和同城中心实现云原生容灾、备份以及数据复制等操作,以满足疫情防控一体化平台对灾备水平的要求。生产中心、同城中心和异地中心的每个资源区均基于OpenStack 架构的云操作系统建立。每个资源区的 SDN 网络、云服务器、存储等相关服务均可独立运行,云管平台的故障不会影响到云内业务的正常访问。
业务数据备份方面,根据政务云主生产中心信息系统特点,英方通过动态文件字节级数据复制技术和持续数据保护技术,建立与生产中心带宽通讯线路,采用异步方式实时在线备份数据,为用户实现重要业务数据的远程实时备份,并为数据备份系统提供运行管理服务。
在异地数据级灾备基础上,英方软件建设了疫情防控一体化平台部分核心系统(如健康码系统)的高可用容灾,保证业务的连续性及后续的可运维性。用户可通过多方联合建设的应急灾备体系,实现系统应用双活、应急区域、同城及异地数据备份、应用应急接管、灾备演练等多体系灾备服务。省疫情防控管理一体化平台可7×24小时全天候服务,实现断网可用,确保了疫情防控期间网络与信息安全工作,全力为疫情工作的正常开展保驾护航。
03总结
2021 年以来,《数据安全法》、《关键信息基础设施安全保护条例》、《个人信息保护法》、《“十四五”大数据产业发展规划》、《“十四五”软件和信息技术服务业发展规划》陆续发布,要求筑牢数据安全防线,打造信息安全强国,推动建设数字化中国,打赢疫情防控战役。
英方软件将持续围绕国家需要及用户需求,推动数据复制技术的创新应用,与生态合作伙伴一起,为信息安全和数字化产业升级护航。