近几年国内发生大规模自然灾害的情况逐渐增多,面对这样一个情况,越来越多的企业考虑在同城双中心的基础上,进行异地灾备,也就是“两地三中心”。
同城双活是指两个数据中心都能实现读写功能,能够同时承担业务,两个数据中心的数据实时保持一致,从而提升整体数据中心的服务效率和资源利用率。当其中一个数据中心业务不可达时,另一个数据中心主动接管所有业务,保障所有数据按全和业务的高可用性。相较于两地三中心,同城双活的成本投入低、运维要求相对简单、构建周期短。
两地三中心就是在同城双活的基础上,在异地增加一个灾备中心,实现同城双中心的异地灾备,当本地发生自然灾难等意外情况时,异地灾备中心能够通过备份数据进行业务切换,保障业务的连续性和数据的零丢失。
同城双活会建立一个数据副本,实时在线更新,一旦由数据下发到生产中心,中心都将数据复制一份到同城灾备中心。同城灾备中心和异地灾备中心之间采用异步复制技术,通过增量复制实现同城灾备中心数据的异地备份,增量复制可以减少数据备份所占用的带宽,缩短数据的备份时间。
两地三中心会根据资源组的状态来判定是否需要进行业务接管切换。在生产中心正常工作时,其资源组的状态显示为online,灾备中心的资源组状态为offline。资源组的状态分为三种:online、offline、fault。onlin和offline的状态下,资源组都能够制定运行脚本和程序。只有当生产中心的资源组出现fault状态时,则表示灾难发生,需要进行业务切换,以保障业务的连续性。应用级容灾自动或者手动的切换模式可以在事前建设时通过修改配置进行实现。
当灾难发生时,需要停止发生灾难节点所运作的业务,切断数据复制链路,建立数据容灾基线,启动容灾节点的部件服务,通知前端设备进行业务的网络切换。灾难发生之后,在确定系统状态能够实现正常的运作时,可以通过手动或自动切换的模式恢复回退,最好选择手动模式,在整体回退前进行轻量级业务的验证,以确定系统环境的稳定性。