Avamar备份恢复:性能测试
王振 发表于:13年07月23日 10:49 [编译] 存储在线
我们采用相同的服务器来测试每个数据保护包。为了能实现像赛门铁克NetBackup和CommVault Simpana数据保护配置中备份服务器和媒体服务器的功能,两个思科UCS C200服务器采用的是10Gbit融合式网络连接。在NetBackup和Simpana服务器处理媒体的配置中,都有一个重复数据删除安装选项。但是在Avamar配置中,只需要Avamar数据存储单一节点以及1Gbit的LAN连接与融合式网络相连。除此之外,Avamar和Simpana配置还包括一个代理虚拟机,使用VMware的SCSI热拔插来备份数据,数据通过LAN连接被转移到媒体服务器或数据存储中。
Avamar虚拟机代理客户端作为一个预先配置好的OVF设备,整合了2个虚拟核心和2GB的RAM。而CommVault虚拟服务器iData代理需要安装到运行Windows server或桌面系统的虚拟机中。
赛门铁克的NetBackup媒体服务器,通过SAN光纤直接进行数据备份。NetBackup所有的备份测试都采用了LAN-free配置,只利用直接的SAN访问虚拟架构硬盘。这样的话,在虚拟机备份过程中,媒体和备份服务器之间大量的网络流量要被认真考虑。
现实世界业务连续性
企业的邮件系统深受IT架构的影响,与电子邮件相关的一系列应用的效率会对整个企业的所有员工的工作有重大影响。这就是为什么企业邮件系统的可扩展性,可靠性,安全性对于IT和公司各部门有深远的影响。于是,我们在运行Exchange 2010的虚拟机上进行了多个细致的备份和恢复测试,来研究备份和恢复操作的效率和性能,以便确定邮件系统业务连续性计划所需要的性能。
每个Exchange DAG(数据库可用组)的配置都是有40GB的系统硬盘和150GB的邮箱数据库。其中一个组被指定为生产活动组。还有一个组中有邮箱数据库的被动副本,用来进行备份和恢复测试。我们使用微软负载生成器工具(LoadGen)在活动服务器上的邮箱数据库中生成一致的可测量邮箱数据。借助生成器,我们很容易就创建了具体的备份和恢复测试场景。
备份测试在虚拟机完全初始化CBT之后进行。在没有CBT的情况下运行一个全备份对于每个应用Avamar的虚拟机来说是一个独特的单次事件,只有使用5.8倍的Avamar硬盘块存储才可以使基于CBT的备份成为全备份。在传统的有独特的全备份和增量备份文件的备份架构中,人们还需要进行没有CBT的周期性备份和综合全备份。
在任何涉及大量数据的备份中,比如说初始全备份,基于SAN的虚拟机备份相对于利用设备的备份有独特的优势,它依赖于VMware的SCSI热拔插访问数据虚拟机的逻辑硬盘进行备份。在SCSI热拔插环境中,备份数据必须要穿过设备的SCSI和网络协议栈,不过不用穿过监管程序的SAN栈,然后才能到达备份服务器。对于同时支持基于SAN和基于设备的备份解决方案来说,采用基于SAN的虚拟机备份方式处理大量数据在一般情况下速度要快上两倍。
即便是这样,虽然运行Exchange的虚拟机初始备份有固有的拓扑优势,但是赛门铁克的NetBackup在备份时间上还是比Avamar少11%,这是一个显著的优势。不过在邮箱数据库中的数据改变了2%之后,再进行虚拟机基于CBT的备份,Avamar的速度就变成了NetBackup的4.8倍,Simpana的3倍。
若赛门铁克NetBackup通过SAN来转移所有的备份数据,那会在LAN网络中出现大量的数据流量。最终的结果就是,LAN网络效率成为影响NetBackup整体性能的重要因素。
备份进程的网络效率可以用备份过程中的平均网络吞吐量来表示。特别是那些低于平均吞吐量的领域,可以用来来判定工作的性能,这和在备份过程中通过转移的数据量来判断性能是一样的。
若采用这种衡量标准,CommVault Simpana通过LAN传输的数据量是Avamar的1.44倍。而赛门铁克NetBackup的总数据流量却相当于Avamar传输的总备份和总数据流量的53倍。
除了为虚拟机建立的CBT元数据以外,另有2%的数据——大概是3GB——被加入到Exchange邮箱数据库中。基于CBT的备份会成为大部分站点的主要备份形式,将会运行在每个备份方案之中。
当Avamar的虚拟机客户端代理在Avamar数据库的配合下进行全球范围内重复数据删除时,Avamar的效率优势就凸显出来了。它能减少使用VMware CBT所需要的总数据量,使传送到Avamar数据库中的数据少于500MB。相比之下,使用Simpana的基于CBT的备份耗时10分钟,而使用NetBackup的基于CBT的备份则耗时14.5分钟。
对于IT管理者来说,更重要的是,VMware的CBT使得创建一个快速基于块的增量备份制度变得相对简单,而且比传统的基于文件的增量备份更有效率。通过把含有在没有CBT的全备份中产生的数据的备份文件和与基于CBT的备份相关的备份文件以一种有序的集合存储起来,创建一种传统的提前的增量备份链。
这种方法创建了一系列连续的复原点与全备份和随后的增量备份相匹配。若想要虚拟机从任何一个复原点复原,需要把全备份作为起始点恢复,然后恢复基于CBT的增量备份,这样才能获得需要的复原点。高级数据保护解决方案能够自动进行这个进程。
打破增量链
对于IT管理者来说,在存储的增量备份链业务中,有一个明显的可靠性问题:在这个存储链中,要是有损坏的或被删除文件,那这条链中后来的备份文件就无效了。因此,减小备份链中的一系列增量备份的体积是非常有必要的。
为了解决在维持最低备份窗口时,增量备份的依赖性问题,中端的备份产品会采用被人们称为“持续增量备份功能”的备份计划,它依赖于周期综合性全备份,是一个整合过程而非真正的备份。不需要读取客户端的数据,综合性备份把最后一次全备份——也可能是综合备份和随后进行的增量备份进行整合,建立一个人为创造出来的备份文件,在其中建立新的备份链。
这个新的综合备份是完整的,独立于以前的备份文件,但是,它也能保存毁坏或被删除的文件,这就是为什么大型的企业级IT站点都把综合备份看作是有问题的。考虑到综合备份的可靠性问题,赛门铁克NetBackup和CommVault Simpana都建议每隔两周进行一次不用CBT的全备份以初始化一个新的备份链。虽然这种策略能减少丢失一系列复原点的可能,但是处理每两周一次的备份是非常没有效率的。
在运行Exchange的200GB虚拟机服务器的测试中,不用CBT的全备份平均完成时间为45分钟。在一年的时间里,在这样的虚拟机上进行26次全备份会增加19个小时的备份进程。更糟糕的是,这些过程要在每个虚拟机上都进行一遍。假设全备份被完美分配,那一个运行42个虚拟机的站点每个虚拟机全备份就需要20分钟——这里指一般情况下的虚拟机,运行驱动数据库的应用程序,数据量大概在75GB到100GB之间——这样,每日的备份计划时长就要增加一个小时来处理全备份。最终,IT运营中进行周期性全备份的授权会反过来影响备份的可扩展性,继而影响到整个虚拟化的投资回报率。
Avamar不从基于CBT的备份中创建增量备份文件,因而避免了这个问题。Avamar并不创建一组分离的备份文件,而是创建一个虚拟的块空间来保护系统。在所有备份中,不管是有CBT的支持,还是没有CBT的支持,块中都含有大量的元数据链接,保存在Avamar的全球虚拟空间中。
每个Avamar的备份都可以看作是一个全备份。每次通过Avamar进行恢复操作,每个受保护系统的每个基于CBT的复原点的全系统映像就会在这个虚拟块空间中进行。没有要关闭的增量备份链,不用进行周期性全备份。
在基于CBT的Avamar备份和CommVault及赛门铁克一直宣称是最佳方式的不借助CBT,每隔两周备份一次的测试比较中,两者的备份时间差异巨大。在每隔两周一次的循环中,Avamar连续的基于CBT的备份进程比CommVault Simpana块18.2倍,比赛门铁克NetBackup快23倍。