在当前大数据全面爆发的时代,随着企业IT建设规模的不断扩大、架构设计的不断复杂,为了避免自然灾害和人为破坏,保障业务数据安全和连续性,异地灾备部署成为主流的解决方案之一。异地灾备中心不止仅仅是将数据通过异步复制到异地灾备中心,还需要具备灾时进行业务系统接管的能力,需考虑将RTO降至最小,为了将业务系统的中断时间降至最低,需缩短灾难切换流程及切换时间。那么该如何实现灾备端的自动切换?
传统的灾备自动切换主要是通过DRP(灾难恢复计划)要求进行实现半自动或者全自动的切换。为了实现灾备的切换,主要会要求架构当中包含以下几个方面:在被环境的监控,主要是对当前灾备环境的整体环境进行识别,检验当前状态是满足灾备端进行切换,并进行信息的输入。通常这部分会与企业的统一监控平台、配置管理平台、应用统一发布平台进行对接,从而获取相关的信息数据。而灾备自动化平台会提供灾备所需资源管理功能作为信息补充。灾备预案的管理,通常由灾备导航或者自动化平台来提供。作为异地容灾架构的大脑,配置并管理完整的场景预案DRP流程,控制切换执行过程中的各项交互与动作。灾备自动化执行,接受预案管理发布的工作内容,并负责在最终环境中执行动作并反馈执行结果。灾备演练设计是否具有针对性,能够验证灾难场景及灾难恢复预案;灾备运维制度是否纳入日常运维管理中,确保灾备环境与生产环境保持一致,灾难发生时能够及时进行生产接管。
如果在实际场景当中希望实现灾备的自动切换,还需要注意一下两点:改变现有的变更流程,在构建前期将可能影响到实际灾备端切换的变更在现有的变更流程中得到反馈和有效的跟进落地,如:在实际环境当中,保障应用变更带来的服务起停的变化同时在生产端和灾备端得到实现。定期灾备切换的落实,桌面演练,分级的实际演练(切换、查询验证,切换、出单验证,以及演练回退)。