对于大部分企业尤其是中小企业来说,自有机房的成本太高,所以上云就成为了一个相对来说成本较低、比较便利的一种选择。随着越来越多的企业和政府机构将数据上云,上云的风险也越来越为大家担忧,即便只是一个小小的宕机都可能引发很大的灾难。
最近几年,云供应商还发生过数起大大小小的故障。就在几天前,谷歌云就宕机了4个小时!此次中断影响到了谷歌所有的产品,从控制人们家里和公寓里控制温度的谷歌Nest到提供购物服务的Shopify, 还有 Snapchat和Discord的社交网络。
在理论上不存在“永不宕机”的云,不说谷歌云,其它的云服务器都或多或少的会出现宕机。导致宕机的原因主要分为两类:1)人为原因导致的误操作;2)云平台故障导致的问题。
但无论是传统的环境还是云环境,都不可能保证业务的永久持续性,相对传统环境来说,云环境的可用性和可靠性都比传统环境高,这主要是因为云平台的运维更加专业。可见,尽管云会发生故障,但云仍然是值得信任的。
那么我们如何才能够安心的上云呢?
信息系统属于企业重要的信息基础设施,其安全问题涉及到核心数据资产,关乎企业生存与发展。而对于信息安全、数据安全,灾备是最基础的技术需求,几乎所有的信息资产都需要灾备保护,以确保在任何意外故障情况下,信息系统的正常运转。企业不能够完全将系统的的可用性寄希望于云服务提供商,对于无法预测的宕机事件,作为企业,能做的只有提前为系统数据做好备份,这样才能够有“备”无患。
针对企业的特点,构建健全的容灾制度、完整的容灾方案、良好的容灾系统,并在实践中不断的进行评估、反复测试、随时调整并加以改善,是刻不容缓的。
接下来让我们来了解一下几种常见的灾备模式:
1.本地容灾
本地容灾是指在本地机房建立容灾系统,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。与异地灾备模式相比较,本地双中心具有投资成本低、建设速度快、运维管理相对简单、可靠性更高等优点;异地灾备中心是指在异地建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。
2.同城容灾
同城容灾是在同城或相近区域内(≤200KM)建立两个数据中心:一个为数据中心,负责日常生产运行;另一个为灾难备份中心,负责在灾难发生后的应用系统运行。同城灾难备份的数据中心与灾难备份中心的距离比较近,通信线路质量较好,比较容易实现数据的同步复制,保证高度的数据完整性和数据零丢失。同城灾难备份一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。
3.异地容灾
异地容灾主备中心之间的距离较远(>200KM),因此一般采用异步镜像,会有少量的数据丢失。异地灾难备份不仅可以防范火灾、建筑物破坏等可能遇到的风险隐患,还能够防范战争、地震、水灾等风险。由于同城灾难备份和异地灾备各有所长,为达到最理想的防灾效果,数据中心应考虑采用同城和异地各建立一个灾难备份中心的方式解决。
4.两地三中心
两地三中心:是指同城双中心加异地灾备的一种商用容灾备份解决方案。两地是指同城、异地;三中心是指生产中心、同城容灾中心、异地容灾中心。
结合近年国内出现的大范围自然灾害,以同城双中心加异地灾备中心的“两地三中心”的灾备模式也随之出现,这一方案兼具高可用性和灾难备份的能力。
5.双活数据中心
所谓“双活”或“多活”数据中心,区别于传统数据中心和灾备中心的模式,前者多个或两个数据中心都处于运行当中,运行相同的应用,具备同样的数据,能够提供跨中心业务负载均衡运行能力,实现持续的应用可用性和灾难备份能力,所以称为“双活”和“多活”;后者是生产数据中心投入运行,灾备数据中心处在不工作状态,只有当灾难发生时,生产数据中心瘫痪,灾备中心才启动。
“双活”数据中心最大的特点是:一、充分利用资源,避免了一个数据中心常年处于闲置状态而造成浪费,通过资源整合,“双活”数据中心的服务能力是翻倍的;二、“双活”数据中心如果断了一个数据中心,其业务可以迅速切换到另外一个正在运行的数据中心,切换过程对用户来说是不可感知的。
在 “双活”的模式中,两地数据中心同时接纳交易,技术难度很大,需要更改众多底层程序,因而在现实中,国内还没有真正“双活”数据中心的成功应用案例。