基于Veeam Backup & Replication V11的持续数据保护架构设计

2022-06-21 08:20陈越东
机电信息 2022年12期
关键词:磁盘过滤器数据保护

摘 要:针对制造企业24 h连续不间断的生产系统,基于其虚拟机环境,设计了基于Veeam Backup & Replication V11的持续数据保护(Continuous Data Protection)架构,给出了系统的架构设计图、数据保留原理图以及测试流程图。该系统主要由备份服务器、主備机房虚拟化系统、I/O过滤器、VMware CDP代理组成,经测试,系统切换时间短,数据同步快,操作简单。

关键词:持续数据保护;CDP;虚拟化;24 h生产

中图分类号:TP309    文献标志码:A    文章编号:1671-0797(2022)12-0024-05

DOI:10.19514/j.cnki.cn32-1628/tm.2022.12.007

0    引言

数据保护一直都是各个企业基础架构的重中之重,对于某些行业,如金融、生产制造、医疗等,每一分钟的数据停机都会造成直接的经济损失,给企业带来重大影响。

进入IT行业以来,笔者一直服务于政府、金融、生产制造行业,根据笔者的经验,从最初单一的数据备份,到之后的采用本地共享存储方式的数据保护,再到后期高级的异地存储镜像数据保护,这些初级或高级的数据保护技术,每一个都有其不足之处,或是实施成本昂贵,或是恢复时间较长,或是技术难度太高。随着IT技术的不断发展,一个新的名词——“持续数据保护”(Continuous Data Protection,简称CDP),开始出现在我们的视野中。

1    持续数据保护介绍

持续数据保护,也称连续备份或实时备份,是指通过自动保存对该数据所做的每次更改的副本来备份计算机数据,实质上是捕获用户保存的每个版本的数据。以其真实形式,它允许用户或管理员将数据恢复到任何时间点[1]。该技术在1989年被英国企业家皮特·马尔科姆(Peter Malcolm)申请为“一种备份系统,在该系统中,对存储介质所做的每个更改的副本都会在更改发生时记录下来”。

CDP作为一项服务运行,可将数据更改捕获到单独的存储位置,有多种方法可以捕获涉及满足不同需求的不同技术的连续实时数据变化。真正的基于CDP的解决方案可以提供精细粒度的可恢复对象,范围从崩溃一致的图像到逻辑对象,如文件、邮箱、消息以及数据库文件和日志[1]。

Veeam公司成立于2006年,从成立至今一直致力于研究数据备份、恢复及管理的解决方案,是行业的领军者。在其2021年最新推出的Veeam Backup & Replication V11版本中,终于实现了针对虚拟机平台的CDP(持续数据保护)技术,可以实现秒级的虚拟机CDP数据同步,为用户提供精确到秒级的RTO(Recovery Time Objective,时间恢复目标)和RPO(Recovery Point Objec-

tive,数据恢复点目标)。

2    系统架构设计(针对××中国投资有限公司)

××中国投资有限公司是一家大型制造企业,其工厂位于上海市奉贤区,厂区内有一期、二期两幢生产大楼,每期大楼内都建设有机房。在两个机房中分别部署了VMware虚拟化环境,其中一期机房为生产环境,二期机房为灾备环境,两个机房之间采用万兆光纤网络连接。通过Veeam CDP进行持续数据保护,当一期机房虚拟化环境发生故障时,可以在0.5 h内将全部虚拟机切换到二期机房,并恢复到15 s之前的数据。整体CDP架构设计如图1所示。

2.1    备份服务器(Backup server)

备份服务器上安装Veeam Backup & Replication软件平台,其上运行有Veeam CDP调度服务。该服务负责管理虚拟机之间的I/O数据的对比、复制和传输,并控制资源分配。

2.2    源集群和目标集群(Source cluster & Target cluster)

源集群由一期机房的vCenter服务器管理,目标集群由二期的vCenter服务器管理,分别包含了各自的物理主机,每台虚拟机数据从源集群的主机复制到目标集群的主机上。

源集群的主机读取虚拟机磁盘数据,通过I/O过滤器处理I/O操作并将数据发送到源VMware CDP代理。目标集群的主机从目标VMware CDP代理接收数据,并在目标主机上的虚拟机副本上保留数据。

此外,目标集群的主机还负责管理虚拟机副本、保留还原点等任务[2]。

2.3    I/O过滤器(I/O filter)

在源和目标集群上安装I/O过滤器后,Veeam Backup &

Replication会自动在添加到集群的所有主机上安装I/O过滤器。

I/O过滤器负责读取和处理在源集群主机中受保护的虚拟机数据的I/O操作,并向目标集群的VMware CDP代理发送数据。

此外,I/O过滤器与备份服务器上的Veeam CDP Coordinator Service通信,并通知该服务,如果源集群和目标集群的VMware CDP代理有任意一个不可用,则CDP同步失败。此I/O过滤器是在vSphere API for I/O过滤(VAIO)的基础上构建的[2]。

2.4    VMware CDP代理(VMware CDP Proxy)

VMware CDP代理是负责数据移动的组件,运行在源集群主机和目标集群主机之间传输数据。需要配置两个代理:一个(源集群代理)在一期生产站点,一个(目标集群代理)在二期灾备站点。B38838FF-7371-4061-8A06-23ACEAFF21C7

源集群代理从源集群主机接收的数据为短期还原点准备数据,压缩和加密数据,然后将其发送给目标集群代理。目标集群代理接收数据,解压缩和解密,然后发送到目标集群主机。

3    Veeam CDP工作原理

3.1    初始同步时期的数据算法

在源主机上,I/O过滤器从虚拟机磁盘读取所有数据并将其发送到源VMware CDP代理。由于原始虚拟机仍在运行,已传输数据块的数据可能会发生变化。I/O过滤器拦截这些更改并将它们发送给代理。发送更改而不是整个更改的数据块有助于最大限度地减少通过网络发送的流量。源代理上的Veeam CDP代理服务对接收到的数据进行压缩、加密并将其发送到目标代理。目标代理上的Veeam CDP代理服务对收到的数据进行解压缩和解密,然后向目标主机发送数据。目标主机上的I/O过滤器将接收到的数据保存到虚拟磁盘中。初始同步完成后,Veeam Backup & Replication开始增量同步。

3.2    增量同步时期的数据算法

在增量同步期间,Veeam Backup & Replication会创建短期和长期还原点。为了创建短期还原点,Veeam Backup & Replication拦截虚拟机磁盘上的事务所做的更改,并将这些更改发送到目标数据存储。更改会不断传输并保存到目标数据存储上的事务日志中。为了创建长期还原点,Veeam Backup & Replication使用短期还原点的数据并将还原点保存到增量磁盘。长期还原点按计划创建。

当Veeam Backup & Replication为短期还原点传输数据时,在源主机上,I/O过滤器拦截所有I/O操作的数据,并将这些数据发送到源VMware CDP代理。进入RPO后,源代理上的Veeam CDP代理服务会准备短期恢复点所需的数据。为此,Veeam CDP代理服务获取源VMware CDP代理所累积数据的最新状态。源Veeam CDP代理服务压缩、加密数据并将其发送到目标代理。目标Veeam CDP代理服务对接收到的数据进行解压缩和解密,然后向目标主机发送数据。目标主机上的I/O过滤器将接收到的数据保存到事务日志中。

当计划创建长期还原点时,如果为CDP策略启用,应用感知处理技术,Veeam Backup & Replication连接到虚拟机操作系统,部署非持久运行时组件或在虚拟机操作系统上连接/部署持久代理组件并执行处理任务,例如静默虚拟机上的应用程序并创建一致的应用程序数据视图。在目标数据存储上,I/O过滤器使用自上一个长期还原点创建以来创建的短期还原点的数据形成长期还原点。新的长期还原点的数据将保存到增量磁盘。

4    保留策略

Veeam Backup & Replication提供两种虚拟机还原点保留策略方案:短期留存和长期保留。

××中国投资有限公司生产线24 h运行,考虑到生产数据的重要性,采用8 h内15 s RPO同步周期的短期留存,由于每天晚上所有虚拟机服务器还有备份作业,因此长期保留采用24 h/个保留一天的策略。超过一天的数据损失从备份中恢复。

4.1    短期留存的数据原理

Veeam Backup & Replication检查复制链是否包含过时的短期还原点。如果存在过时的还原点,Veeam Backup & Replication会将短期还原点的数据从事务日志文件提交到最近的技术点(TP),如图2所示。

如果事务日志文件不包含更多短期恢复点的数据,Veeam Backup & Replication会将事务日志文件删除为冗余——其数据已提交到技术增量磁盘文件中,如图3所示。

在没有相关事务日志文件的技术点仍然存在时,Veeam Backup & Replication会认为该技术点已过时,并将较新的技术点的数据提交到过时的技术点中,如图4所示。

4.2    长期保留的数据原理

Veeam Backup & Replication檢查复制链是否包含过时的长期还原点。如果存在过时的恢复点,Veeam Backup & Replication会重建过时的长期恢复点(LTRP)的文件,以包含更新的长期恢复点的数据。为此,Veeam

Backup & Replication将与长期还原点相关的最早增量磁盘文件中的数据提交到基础磁盘文件中。基础磁盘文件在复制链中向前“移动”,如图5所示。

Veeam Backup & Replication会从链中删除最早的增量磁盘文件作为冗余——该数据已提交到基础磁盘文件中,如图6所示。

5    切换测试

CDP的切换测试模拟某台虚拟机故障前15 s在桌面新建文本文件,使用Failover功能切换到CDP备机,检验15 s前的文本文件存在,之后运行一段时间修改CDP备机文件内容,模拟原虚拟机修复,使用Failback to production功能将增量数据回迁到原虚拟机,确认文本文件修改内容无误,使用Commit failback永久回迁。

5.1    切换(Failover)

将原虚拟机关机,在Veeam中选择已经ready的CDP备机,右键选择Failover now,选择最近的一个系统还原点15 s前,等待切换完成,花费时间65 s。可以发现CDP备机已经自动启动,打开CDP备机,检查桌面上在17:06:21新建文本文档存在(图7),说明15 s前新建的数据同步正常。

5.2    回迁(Failback)

在新建文本文件上加入当前时间内容,针对CDP备机选择Failback to production,等待回迁过程对比磁盘变化量后回迁完成,花费时间100 min。此时CDP备机已自动关机,原虚拟机自动启动,打开原虚拟机,检查桌面新建文本文件新增内容存在(图8),证明新增数据已同步回原虚拟机。

5.3    永久回迁(Failback)

确认数据正确无误后,选择Commit failback,将原虚拟机状态置为生产,CDP同步作业将自动继续,永久回迁完成时间75 s。

6    结语

本设计中,通过Veeam Backup & Replication V11的持续数据保护功能,实现了15 s内的即时数据同步,当生产环境发生故障时,能够在分钟级别的切换时间内,将××中国投资有限公司的全部虚拟化系统迁移到灾备机房,保证了生产线的持续工作及数据不丢失,是对各类24 h生产及数据敏感企业非常有效的保护机制。

[参考文献]

[1] 赵学军.数据容灾技术介绍[J].电子世界,2012(9):98-100.

[2] 薄鹏,王春海.使用Veeam实现vSphere虚拟机的CDP复制[J].网络安全和信息化,2021(7):53.

收稿日期:2022-03-10

作者简介:陈越东(1977—),男,上海人,工程师,研究方向:计算机系统集成。B38838FF-7371-4061-8A06-23ACEAFF21C7

猜你喜欢
磁盘过滤器数据保护
它的好 它的坏 详解动态磁盘
解决Windows磁盘签名冲突
欧盟最严数据保护条例生效 违反将严惩不贷
欧盟“最严”数据保护条例生效
针对石化行业过滤器流阻的探讨及研究
未成年人能不能上社交网络
Windows系统下动态磁盘卷的分析与研究
花粉过滤器
新型纳米材料过滤器
基于混淆布鲁姆过滤器的云外包隐私集合比较协议