由于磁带数量过多、备份时间太长,促使宏?采用重复数据删除。透过重复数据删除,宏?每日全备份的数据减少13倍,更让未来网络传输的异地备份机制成为可能。
很多企业的IT部门都会面临一个问题,那就是磁带备份相关设备永无止尽地成长。这还不是最糟的,当企业需要做到异地备份时,随着数据量的快速成长,每天备份的磁带量也越来越多,除了管理磁带和运输上都越来越麻烦之外,需要备份的数据太多,也往往会让企业无法在可备份的时间内完成系统数据的全备份。
磁带数量过多、备份时间太长,促使宏?采用重复数据删除
这些令IT人员一个头两个大的问题,宏?(Acer)都遇到了。随着营收逐年增加,宏?的信息系统每日数据量也快速增长,从2002年原本约400GB的数据备份量,仅3~4年后,每日需要备份的数据量已经高达1.7TB左右。
宏?信息安全与服务部经理柳炳智表示,当时遭遇最大的挑战,首先就是整个数据备份机制无法顺利运作。宏?有异地备份的机制,数据备份策略是这样的,核心系统的ERP数据,每日制作全备份;其他数据是周一至周五仅备份新增的数据,保留5天;周六则进行全系统的备份,保留一个月,这些数据都备份至磁带,每天由车子运送到龙潭机房,进行保存。此外,资料种类也很不一,以1.7TB的数据量来看,其中Lotus Notes所产生的数据最多,每天约840GB,其次则是Windows的档案数据,约560GB,由于大大小小档案不一,零散的小档案写入磁带较慢,使得写入的效率不彰。
在这样的状况下,宏?虽然将LTO-2磁带机与备份服务器、多媒体服务器增加至3套,但仍然无法解决备份速度过慢的问题。柳炳智说:「后来的状况,甚至已经无法在12小时内完成当日的备份,平均数据备份到磁带的速率为90MB/sec,遇到细碎的小档案,速度还会更慢。每天仅能备份约3.24TB左右的数据。」
另一个挑战则是磁带运送的问题,随着数据量越来越多,磁带的运送和管理也越来越不易。举例来说,因为每日备份都以磁带储存,当发生需要把备份的数据重新输入系统时,IT人员必须等待龙潭机房将磁带透过卡车送回公司,而后再慢慢输入。「比如说,6点下班前接到消息说要重新把备份的数据输入系统,等到磁带到达,整个流程做完,大概都晚上12点了。」柳炳智说。
采用重复数据删除,每日的备份的数据量平均少了13倍
为了解决这些问题,最后在2006年,宏?决定采用Data Domain的重复数据删除设备DD565。柳炳智表示,之所以会选择使用重复数据删除技术解决这个问题,是因为在测试时发现,透过重复资料删除的技术,该公司每日备份的数据量,平均可以有效减少数据量将近13倍,最高更有40倍的压缩率。这将能够协助该公司建立起D2D2T(Disk to Disk to Tape)的数据备份架构。
柳炳智以该公司的Lotus Notes邮件数据来测试重复数据删除的结果为例,840GB的备份数据,经过重复数据删除技术的设备,去除重复的数据后再进行压缩,如果整体以40倍的压缩率来看,需要备份数据仅剩21GB。也因此,可以解决宏?因为需要备份的资料过多,而无法在备份时间内完成当日数据备份的问题。
此外,采用重复数据删除技术也让宏?成功的建立起D2D2T的数据备份架构,也改变了该公司磁带备份的策略。柳炳智表示,现在该公司每周仅需在周日一次将数据备份至磁带,之后再送到龙潭即可,其他备份数据均可储存在重复数据删除设备的硬盘中,磁带则是用来储存长时间归档的数据,解决了过去备份数据如果需要重新输入系统中,一来一往耗费过多时间的问题,也省下了每日运送磁带的人工。「事实上,磁带量也大幅减少,管理上也更为容易。」柳炳智说。
重复数据删除也让未来将建置的WAN异地备份成为可能
虽然利用重复数据删除技术让宏?建立起了D2D2T的数据备份架构,解决了很多过去因为磁带备份衍生而出的问题,但宏?接下来还想更进一步扩张现有架构,解决数据处理瓶颈与实体磁带运送的问题。柳炳智表示,现在宏?在数据备份上,面临了另一个瓶颈,那就是现有3台备份服务器和媒体服务器的负荷量已经过重。宏?是采用赛门铁克的Veritas做为备份软件,现在每台备份服务器和媒体服务器能够承受每日1.5TB的数据备份流量,也就是每天有能力备份4.5TB的流量。但随着数据快速成长,服务器已经开始出现不堪负荷的现象。
为了解决这个问题,柳炳智指出,接下来宏?将再增加3台媒体服务器,以每台可负荷4.5TB的流量来算,未来希望可以让宏?每天可以负荷9TB的备份流量。此外,也将把现有的3台磁带机,换成1台LTO-4的磁带机。根据宏?IT部门的估计,1台LTO-4磁带机处理备份数据的容量和速度,就能抵上现行的3台LTO-2磁带机。
除此之外,宏?还将再导入1台重复数据删除设备,做为异地备份之用。柳炳智表示,由于重复数据删除技术平均能将数据量减少13倍,这将让宏?直接以WAN传输数据至龙潭机房转存成磁带的应用成为可能,由于现在使用的重复数据删除设备支持此一功能,多添购一台,放在龙潭机房,然后两台设备透过网络互传备份的数据,就能完全省去运输实体磁带所需的成本。
他以先前测试的结果为例,如果透过重复数据删除技术筛选后,每天多出的数据仅21GB,以T1专线来传输,30小时就可传输完毕;若以T3专线,2小时以内就可以结束。「也是因为重复数据删除技术,WAN传输备份数据才比较可能,否则带宽需求太大。」柳炳智说。