重复数据删除第一次使用是出现在专用设备上,是用来辅助现有的备份应用如NetBackup或Networker等应用进行更好的备份。我的一个朋友W. Curtis Preston近来公布了一个图表,详细比较了当前这些设备的性能。这样一来有关重复数据删除设备的问题就有了答案。但在备份过程中,像我在哪里可以删除重复数据,我在哪个位置备份数据是最好的等这些问题还没有准确的答案。
重复数据删除设备性能比拼
对于每晚都要备份TB数据的大型数据中心,主要看的就是设备。如果你能创建足够大的备份流量,并且你使用的是像Data Domain的DD800或Quantum的DXi 8500那样的高端设备,这些设备每秒可以吸收1.5GB甚至更多的数据,那么如果不是多个备份应用,你就可以通过多种媒介服务器来完成。
在这些环境中,使用一种单一大型设备,或像NEC的HydraStor那样在每秒可以接收27GB相当于97TB/小时的阵列,就可以直接让你的单一设备来管理所有新的备份数据。这也就意味着你所有的数据都存在于一个单独的重复数据删除存储池中,因此Windows C主管你物理服务器上的NetBackup备份和和虚拟服务器上的Veeam备份,如果排列是正确的,那么只需要存储一次即可。
但是对于仅有2TB到50TB的数据需要保护的小公司来讲,公司是应该购买昆腾的Dxi6510或者DataDomain的DD610呢,这些设备每个磁盘的空间是6TB(在RaiD之后但是重复数据删除之前),成本大概是五万美金,还是使用具有重复数据删除特征的备份软件,相对低端的磁盘阵列如来自Overland Storage, Promise, Infortrend这些公司的产品。我就不那么确定了。
这取决于他们使用的重复数据删除备份软件,将会增加2到2万美元的成本,并且一个低端阵列和12个1TB的驱动也会增加另外的8到12k美元。或者中型应用更好呢?
这个答案主要看三个方面。首先,要看他们的代理是否能整合软件和阵列。一个系统通过整合可以创造四到五倍的价值。
其次要看复制的问题。如果分公司需要给总部复制数据,这时就会看到公司是节省了资金还是浪费了资金。从DataDomain或昆腾的设备中复制到另一个是比较容易的,并且带宽也很高效。另一个可以采取的方案是把磁带运过去。这种方法是最不保险的,因为可能会丢失。
最后的一个开放性问题是媒介服务器重复数据删除有多快?设备供应商宣扬他们的性能,但我从来没看到备份软件供应商讨论它。备份Exec有多快,Simpana重复数据删除备份有多快?你需要哪种磁盘来获得更好的性能,你需要SSD像其他应用一样保留哈希索引吗?
这些问题都很难得到准确答案,但是你需要询问你的潜在供应商列出数据来支持他们所说的性能,并且比较在你的存储架构上增加重复数据删除后的成本,这样就可以更好的选择使用重复数据删除了。