网络安全和信息化 | 数据副本管理的技术应用实践

时间:2021-11-25 栏目:技术前沿

本文选自《网络安全和信息化》2021(11):73-75.

黄亮、郭颖/上海英方软件股份有限公司

摘要:CDM 数据副本管理技术集中整合了数据的保护及管理使用,不仅通过正确地存储数据来降低存储、容灾成本,还能通过自动化、流程化地管理数据副本来加快数据的使用效率,在可靠性和敏捷性两个 IT 模式环境中为用户带来价值,助力数字化转型。 

背景介绍

在企业传统 IT 环境下,通常需要创建多个数据副本开展业务,如数据验证、合规检查、数据分析等,特别是在开发测试环境中,需要大量、频繁地建立数据副本。

据 IDC 统计,2018 年总体用于复制数据存储的大概花费为 506.3 亿美元,企业 45%-60% 的总存储容量用于专门存放复制数据。数据在增长,而复制数据更是呈指数级增长。指数级增长的数据副本带来了存储空间、网络性能的压力,进而使得数据的安全、管理以及恢复任务变得更加困难。

在此背景下,复制数据管理(Copy Data Management,CDM)的概念出现。2016年,Gartner 的一篇报告《Innovation Insight: Copy Data Management Accelerates Bimodal IT》定义了 CDM,即“复制数据管理”。复制数据管理(Copy Data Management,CDM)解决方案用来加速双模式IT(Bimodal IT:一种是可以精确预知的,强调可靠性;一种是探索型的,强调敏捷性)运作的落地,产生直接的业务价值。

二、复制数据的黄金副本

复制数据(Copy Data),是指在任何时候主生产数据被创建出来并用于第二目的数据副本。它可以用于对主数据的保护,应用程序的测试、研发、分析和可用性演练。

根据 IDC 的报告,复制数据管理显著地降低了总体存储成本,CDM 平台方案也正在用来加速双模式 IT 运作的落地。它已经帮助用户产生直接的业务价值。

在强调可靠性的场景中,CDM 可以实现更小的数据丢失量、数据快速恢复、简单的配置和管理、降低存储和备份容灾的成本,以及横向的扩展。

在强调敏捷性的场景中,CDM 可以实现基于自服务的数据副本的分配、基于自服务的虚拟克隆功能、基于自服务的数据更新、动态的数据脱敏和防止资源滥用。

CDM 更大的价值是盘活了冷数据,唤醒了躺在存储介质上的沉睡数据,因此复制数据已被许多行业人士称为黄金副本。

三、传统备份容灾和恢复方式带来的挑战

相比于离线型灾备(冷灾备)和在线型灾备(热灾备),CDM 作为新兴的灾备技术方案,相比传统备份技术,它具有以下优点:

  • 初始全量数据 + 持续增量数据备份,解决了大数据库的备份窗口大的问题。
  • 备份数据可以直接使用,而不像传统备份必须将备份数据进行恢复,这样就能实现分钟级别的恢复。
  • 备份数据可以通过快照技术虚拟出多个黄金副本数据,但不占用实际存储空间,极大的节约存储空间的占用。
  • CDM之间可以实现数据复制,异地数据也可以直接使用,实现异地容灾和灵活的灾备演练方式。
  • CDM 提供敏捷化的数据服务,类似备份、容灾、测试数据环境搭建等等,将以往需要数小时的搭建周期缩短至分钟级,降低时间成本。

四、数据副本管理采集技术介绍

相比于传统数据副本管理采用固定接口备份的定时策略,新的数据副本管理领域对于数据采集技术更强调实时性和多样性,例如可以基于字节级实时复制、数据库语义级(SQL)实时复制和块级的实时复制技术。

字节级实时复制技术是基于主机层的复制操作,无需应用层访问权限,在原始数据初始化镜像后,实时捕获字节级增量数据的变化,并传输到备端保存,且差异比对和序列化传输能够保证数据的一致性。

△字节级复制

数据库语义级(SQL)实时复制采用日志抽取分析和数据库数据流实时同步技术,对业务系统的数据进行无缝实时传输,支持异构且状态实时监控,能够对数据库数据进行同步和灾备保护。

△数据库语义级复制

块级的实时复制技术对卷管理层进行实时捕获监控,将生产服务器侧捕获的磁盘块数据传输到灾备中心服务器,灾备服务器可以对复制过来的数据卷执行快照克隆操作并挂载给其他服务器使用。

△块级复制

上述三大数据复制技术能够针对不同场景,进行多层次的数据采集、复制、传输,为用户带来如下价值:

  • 备份数据分钟级的恢复;
  • 对各类数据库及应用程序实时监控保护;
  • 发生物理故障时,实现秒级切换,保证业务连续性;
  • 集成虚拟化平台,分钟级创建虚拟机,并直接用于开发、测试、分析等环境;
  • 存储资源节省 80%~90% 的成本效益。 

五、数据副本管理的应用实践

数据副本管理作为数据时代新的应用趋势,它不仅解决了传统容灾备份的痛点,还提供了高附加值的数据管理功能。在数据副本管理的应用实践中,可以通过“副本获取、副本管理、副本使用”了解其应用过程。

  • 副本获取

将整个操作系统卷及数据卷拷贝同步到备份服务器上,作为全量备份数据。每当生产环节后续对源主机数据进行更改时,通过磁盘块变化追踪技术(CBT)捕获磁盘块变化数据,持续复制到目标服务器上,在后台自动合成基于时间点可恢复的备份数据。

△基于块复制技术可用于整机系统的备份恢复

  • 副本管理

备份服务器保存一份初始的全量数据,根据用户预先设定的备份策略,将连续的增量数据保存为某一时刻可以用来恢复的快照。此快照能够快速克隆出独立于生产系统的数据副本,可读可写。

  • 副本使用

根据需要恢复的副本时间点,数据副本管理平台可即时产生虚拟副本,备端服务器集成的虚拟化平台可自动创建虚拟机,打开虚拟副本,实现整机应急接管和演练。

基于数据副本管理平台多层次多策略的灾备策略,用户可以通过超融合数据管理平台或数据副本管理一体机,可在本地应用级容灾、同城应用容灾系统和异地应用级容灾系统等场景广泛使用,帮助用户实现副本数据从获取到管理到应用的高附加值。

△数据副本管理在容灾场景中的应用

六、总结与展望

在数据价值不断被挖掘的当下,CDM 的大规模应用,集中整合了数据的管理和使用,不仅能通过高效、一致的数据传输降低容灾备份成本,还将从多模式采集、跨平台流动、多策略保护管理和安全存储、归档的全生命周期管理等方面,串联起业务数据,让数据价值的可量化、可视化和可复用成为可能,在可靠性和敏捷性两个 IT 模式环境中产生价值。

及时响应,快速服务,为您保驾续航

立即注册

请先完成图形验证

验  证  码:

请先完成图形验证

验  证  码:

隐私声明
当您在本网站进行合作伙伴注册登记,本网站将收集您的相关信息,并保存记录。本网站收集的个人信息包括但不限于:姓名、地址、公司、所在地区、电话号码以及电子邮件地址等。您主动提供的信息越多及越准确,我们就能够更好地为您提供有关服务。
咨询·购买