数据存储产业服务平台

VTL重复数据删除功能解决用户难题

存储在线3月13日编译 《亚利桑那州共和报》采用了DataDomain的重复数据删除系统来减少数据存储需求和备份成本。

《亚利桑那州共和报》存储部门的任务既像存储客户又像存储厂商。它需要备份自己的数据,还需要备份母公司(Gannett)旗下其他实体的数据。它使用多种系统和备份方式。因此,这个出版实体经常处在备份技术的前沿,比如部署重复数据删除系统来满足日益增长的存储需求。

《亚利桑那州共和报》成立于1890年五月,是该州最大和最有影响力的报纸。该公司同时也是互联网媒体的先驱,早在1995年就建立了一个网站。2000年,Gannett收购了这家报纸及其关联的其他产业。Gannett是一家国内新闻媒体集团,旗下媒体包括《今日美国》等。

这家亚利桑那州的媒体公司现在大约有450-500台服务器,运行着各种操作系统,如Linux,Solaris,IBM AIX,X86和VMware等。《亚利桑那州共和报》的首席系统管理员John Tabor表示:“在媒体行业,各家公司开发了许多定制的应用程序,因为我们没有很多现成的应用程序可用。”

该公司目前管理者超过100TB的信息内容。因此,高公司使用多种备份手段和系统,比如CommVault的Simpana,EMC的Legato和Symantec的NetBackup。该媒体公司在服务器上遇到了备份时间瓶颈,大部分备份工作需要在周末进行。一些数据是每天备份,而另一些则需要每周备份。

满足备份窗口成为一个持续性的难题,这就是为什么该出版实体很早便采用虚拟磁带库(VTL)系统的原因之一。2003年,《亚利桑那州共和报》决定不再采用磁带来备份日益庞大的SAN(存储局域网),因为磁带这种备份方式既昂贵且耗时太长。该媒体公司选择EMC的VTL来支持存储网络。

随着该出版商增加其他的系统,比如网络附加存储(NAS),VTL需要备份的数据量也在不断增加。NAS是每天备份,而该系统的数据量从4TB增加到了12TB。Tabor表示:“我们到了需要增加另一个系统的时候了。”

EMC的产品是很好,但是和许多第一代VTL一样,它不能支持重复数据删除。因此在2007年,这家出版公司决定选择一个有重复数据删除功能的VTL。《亚利桑那州共和报》将选择范围缩小到了Data Domain和EMC。前者提供了更为简单的升级方式。Tabor表示:“EMC系统是‘推倒重来’的升级方式;但是如果采用Data Domain系统的话,那么我们只需要在现有系统中加入Data Domain系统而无需再购买新的磁盘。”

Data Domain系统的功能让该出版公司觉得物有所值。新产品花费了大约12万美元,和购买新磁盘容量的成本相近。但是由于该VTL能够更有效地利用现有存储,因此不用再购买新的容量。此外,支持VTL的Symantec NetBackup软件是按照裸容量来收费而不是按照虚拟容量,因此新VTL的重复数据删除功能让该新闻媒体得以改善VTL存储利用而无需增加软件使用成本。

去年夏天,该公司购买了Data Domain系统并开始测试。测试过程进行得很顺利,因此该系统很快就得以部署。Tabor表示:“我们在系统安装的同一天就创建了VTL。”新系统提供了强大的功能,比如可以在一分钟或更短时间内进行即时的恢复操作。

不过,该系统的部署也非一帆风顺。首先,该系统不支持多路径,而该媒体在它的冗余光纤数据中心网络中使用了多路径技术。这个问题很快得到了解决。在开始的时候,该媒体公司还有些担心该系统的性能。重复数据删除排除冗余数据,减少需要备份的数据的数量,缩短了备份时间。Data Domain在开始的时候声称该系统能带来20X的提升——将100TB数据减少到10TB——但是该媒体公司只实现了7-10X的提升。在仔细分析该媒体公司提交的性能报告之后,Data Domain的技术支持人员认为一个一次性备份操作是导致结果不理想的主要原因。Tabor说:“我们出现了一次紧急事件,并使用了VTL来备份一个图片归档。”在该公司第一次使用重复数据删除功能的时候,该系统会建立必要的索引;只有在建立索引之后,性能提升的效果才能体现出来。而这个案例正是因为这个原因才显得提升效果不明显。

现在,该系统重复数据删除功能的效果已经很明显,该媒体公司正计划扩展它的VTL。该公司计划修改VMware备份,越过Symantec Netbackup系统,直接将它们迁移到磁盘。Tabor表示:“自从增加了重复数据删除功能之后,我们现在的存储管理效率大大提高。”

未经允许不得转载:存储在线-存储专业媒体 » VTL重复数据删除功能解决用户难题