谷歌如何备份互联网和海量数据

时间:2014-03-04 栏目:技术前沿

雷蒙布卢姆(Raymond Blum)领导着一支站点可靠性工程师团队,主要负责谷歌数据的保密性和安全性。当然,谷歌永远也不会透露那些数据的总量是多少,但是从其高管的言语中来看,那些数据总量没达到YB级至少也达到了EB级。仅Gmail服务的相关数据就达到了EB级。布卢姆在解释谷歌如何互联网时称,常规的备份策略在谷歌是行不通的,原因是:在一般情况下,它们会随着容量进行调整。
他谈到了以下要点:

  • 从未出现过数据丢失的事故。即使在GMail服务宕机时也没有丢失过数据,但是这比磁带备份要复杂得多。 整个系统的各个地方都需要检索数据,这就要求它在包括人在内的每一个层级上都提供引擎。
  • 备份无用。它其实是你最关心的数据恢复功能。它是一个恢复系统而不是备份系统。备份只是数据恢复战略中的一部分内容。 将任务转至备份,让它具备所需的各种功能,以便将数据恢复工作尽可能地简化。
  • 你无法按比例调整。如果数据量增加一百倍,你不可能将人力资源或机器资源也增加一百倍。你应该去寻找倍增器。 自动化是提高利用率和效率的重要方法之一。
  • 无处不在的备用冗余。谷歌有很多种服务,总是会有某一些服务出现故障。 这是不可避免的,就象人体内的细胞也在不停地老化死去一样。 谷歌从未想过能够避开这种情况,而是未雨绸缪地制定对应的计划。
  • 无处不在的多样性问题。如果你担心某个站点不完全,那就请把数据放到多个站点上储存。 如果你担心的问题是用户误操作,那就请设置各种隔离政策,对用户互动进行限制。如果你想免于受到软件漏洞的危害,那就请使用不同的软件。 将数据保存在不同厂商的设备上可以减少软件漏洞的危害性。
  • 将人中整个工作流程中解放出来。Gmail保存了多少份电子邮件的副本? 人们不应该去关心这样的问题。有些参数是由Gmail设置,然后由系统来管理的。 这是惯例。高级政策设置完成后,系统就会照此执行。 只有出现超常规的事情后,才需要人工介入。
  • 用实际应用去证明它。如果你根本就不去尝试,那么它肯定是无法正常工作的。 备份和恢复一直处于被测试状态中,目的是验证它们是否能够正常运作。 不管是大型企业还是小型企业,都能从中学到不少知识。

及时响应,快速服务,为您保驾续航

立即注册

请先完成图形验证

验  证  码:

请先完成图形验证

验  证  码:

隐私声明
当您在本网站进行合作伙伴注册登记,本网站将收集您的相关信息,并保存记录。本网站收集的个人信息包括但不限于:姓名、地址、公司、所在地区、电话号码以及电子邮件地址等。您主动提供的信息越多及越准确,我们就能够更好地为您提供有关服务。
咨询·购买