虚拟化在灾难恢复和业务连续性方面的具体应用(三):「英方周末」第二十期

时间:2016-09-19 栏目:技术前沿

虚拟化在灾难恢复和业务连续性方面的具体应用(三)

\

导语

基础设施组件的可用性策略的一个关键元素是HA(高可用性)。HA通常与网络设备例如防火墙、路由器和负载均衡器有关。在HA配置中,一个设备被指定为主要设备,其他的是一个完全相同配置的冗余设备,如果主设备故障,它们能接管处理功能。相同的概念在许多方面也能应用于虚拟化基础设施,在这里多个管理程序可以设置为主机虚拟机,其中一个是主机,其他的是冗余或故障恢复系统。容错性是VMware特定的概念,它提供了虚拟机可用性和冗余的不同方式。

 

今天,我们将动手与大家一同在VMware vSphere中设置高可用性和容错性。

 

vSphere5的高可用性是真正意义虚拟机的“恢复和重启”。如果启用高可用性的管理程序失败,虚拟机将被恢复,并在另一个启用高可用的主机上重启。一个ESXi主机被指定为主服务器,它维护集群中从服务器的心跳和缓存集群配置信息,向集群中的vCenter报告HA的状态。

为了在vSphere集群中启用HA服务,按照下面的这些步骤进行:

 

1)右击“现有集群”,选择“编辑设置”。然后选中标签为开启vSphere HA的框。

 

2)在“结果”页面,有几个重要的配置选项,如下:

  • 启用主机监控

    这个选项将创建一个主机间的“心跳”服务,如果网络或本地服务终端使主机不可用,它通知每个集群成员。强烈建议选中这个框,除非使用其他网络监控或负载均衡工具,它检查心跳或持续监控所有集群成员。

  • 允许控制

    启用允许控制将防止动态迁移的虚拟机加电,当在主机上启用时将导致资源消耗问题。建议在任何启用HA集群中启用允许控制。

  • 允许控制策略

    如果启用了允许控制,那么可以选择哪个类型的策略将管理它的行为。可以指定允许的最大主机故障数量,保留一个“备份”CPU百分比(换句话说,当剩下这个比例时,允许控制启动),或要迁移的虚拟机待定故障主机。

 

3)下一个HA选项是在标签为“虚拟机选项”的菜单类型。这里的每个虚拟机有两个选项或者在集群中所有虚拟机的全局等级(单个虚拟机设置覆盖全局集群设置):

  • 虚拟机重启优先级

    指定要虚拟机在主机故障时启动备份的顺序,全局设置时默认设置,单个虚拟机可以配置高于或低于这个阈值。

  • 主机隔离响应

    如果一个管理程序失去它的控制台链接但仍在运行,这个设置将决定它如何管理它拥有的任何虚拟机。可以选择让它们通电、断电(硬关闭)或关闭(首先关闭OS,然后断电)。建议如果可能让它们通电或执行操作系统关机,减少损坏或数据丢失。这比硬关闭要慢些,但是,硬关闭可能导致性能问题。

 

4)下一个HA配置区是虚拟机监控。这里,可以使用VMware工具集成启用或禁止虚拟机心跳监控。建议为虚拟机和应用程序启动这项。也可以配置集群的监控敏感性。设为低(120秒)、中(60秒)、和高(30秒),或你可以通过指定下面的选项配置定制的设置:

  • 故障间隔:在心跳丢失后声明虚拟机故障的秒数
  • 最小开机时间:秒数,在故障间隔检查开始之前虚拟机必须启动的时间
  • 每个虚拟机重置的最大值:一旦检测到故障,虚拟机被重置的次数
  • 最大重置时间窗口:小时数,在这段时间最大重置设置之行

 

5)HA的最后菜单项屎数据库心跳。这里,当vCenter的管理网络故障的时候,可以选择维护vCenter中预定义数据库对象上的心跳。可以选择监控任何集群数据库,首选的数据库,或任何要包含的任何数据库(建议设置)。

 

6)当完成的时候,单击OK保存你的修改

容错(FT)是另一个当今vSphere平台上的关键可用性功能。容错派生于原始VMware工作站记录/重放功能。本质上,FT创建一个虚拟机的副本,将它与原始保持“步伐一致”。如果原始虚拟机有问题,FT立刻将它的功能传输到副本,它将以几乎实时方式跟随所有原始版的关键功能。

 

在FT启用和利用DRS和启用HA的集群中,必须满足许多前提条件。

  • 启用主机证书检查
  • 在有虚拟机的集群上启用HA
  • 在每个ESX/ESXi主机上设置虚拟网卡和启用FT日志。
  • 提供兼容FT的CPU

 

而且,启用FT的虚拟机必须没有快照,这对一些组织是真正的挑战。

为了在虚拟机上启用FT,右击虚拟机,选择容错,然后单击单开容错。将得到一个警告消息,如果接受,虚拟机将准备好,然后启用FT。一旦FT启用,将看到虚拟机的图标变成了一个小的集群方块,FT功能和状态被显示在虚拟机的概述页面。

 

如你所知,虚拟化并不仅仅只有VMware一家,下一期,我们将共同实践如何在Microsoft Hyper-V和Citrix XenServer中设置高可用性和容错性。

 

 

 
 
 
相关阅读:

 

虚拟化在灾难恢复和业务连续性方面的具体应用(一)

虚拟化在灾难恢复和业务连续性方面的具体应用(二)

7×12 小时服务支持,为您保驾续航

立即注册

400-617-8601
官方微信
企业QQ:4006178601
技术QQ群:532148075
群内福利多多,请加入!