谷歌如何备份互联网和海量数据

时间：2014-03-04 栏目：技术前沿

雷蒙布卢姆(Raymond Blum)领导着一支站点可靠性工程师团队，主要负责谷歌数据的保密性和安全性。当然，谷歌永远也不会透露那些数据的总量是多少，但是从其高管的言语中来看，那些数据总量没达到YB级至少也达到了EB级。仅Gmail服务的相关数据就达到了EB级。布卢姆在解释谷歌如何互联网时称，常规的备份策略在谷歌是行不通的，原因是：在一般情况下，它们会随着容量进行调整。
他谈到了以下要点：

从未出现过数据丢失的事故。即使在GMail服务宕机时也没有丢失过数据，但是这比磁带备份要复杂得多。整个系统的各个地方都需要检索数据，这就要求它在包括人在内的每一个层级上都提供引擎。
备份无用。它其实是你最关心的数据恢复功能。它是一个恢复系统而不是备份系统。备份只是数据恢复战略中的一部分内容。将任务转至备份，让它具备所需的各种功能，以便将数据恢复工作尽可能地简化。
你无法按比例调整。如果数据量增加一百倍，你不可能将人力资源或机器资源也增加一百倍。你应该去寻找倍增器。自动化是提高利用率和效率的重要方法之一。
无处不在的备用冗余。谷歌有很多种服务，总是会有某一些服务出现故障。这是不可避免的，就象人体内的细胞也在不停地老化死去一样。谷歌从未想过能够避开这种情况，而是未雨绸缪地制定对应的计划。
无处不在的多样性问题。如果你担心某个站点不完全，那就请把数据放到多个站点上储存。如果你担心的问题是用户误操作，那就请设置各种隔离政策，对用户互动进行限制。如果你想免于受到软件漏洞的危害，那就请使用不同的软件。将数据保存在不同厂商的设备上可以减少软件漏洞的危害性。
将人中整个工作流程中解放出来。Gmail保存了多少份电子邮件的副本？人们不应该去关心这样的问题。有些参数是由Gmail设置，然后由系统来管理的。这是惯例。高级政策设置完成后，系统就会照此执行。只有出现超常规的事情后，才需要人工介入。
用实际应用去证明它。如果你根本就不去尝试，那么它肯定是无法正常工作的。备份和恢复一直处于被测试状态中，目的是验证它们是否能够正常运作。不管是大型企业还是小型企业，都能从中学到不少知识。

关闭

Cookies Consent

谷歌如何备份互联网和海量数据

时间：2014-03-04 栏目：技术前沿