我认为可以安全的说——重复数据删除技术用于备份端现在已经成为主流。在企业层面,我们估计,几乎所有的公司都已经安装了某种形式的重复数据删除技术,甚至在重复数据删除管辖下的数据百分比接近40%。换句话说,每个企业都有重复数据删除设备,但并不是所有的备份数据都已经被重复数据删除。每个企业的原因各不相同(重要的应用、地理上的孤立、有限的资金,等等)。当人们通过背后的调查发现,一些重复数据删除发生在源端,但大多数在目标端,确切的说实在目标端设备上。
显然,EMC(Data Domain和Avamar)在今天定义了重复数据删除世界的规则。其他竞争者包括IBM的ProtecTIER、NetApp、昆腾、赛门铁克的 PureDisk、Sepaton和惠普(包括OEM Sepaton和自己的B43xx系列)。最近惠普宣布了B6200系列。ExaGrid公司有一个产品,但它主要是为了迎合中小企业市场空间。一些其他备份产品有内嵌的重复数据删除。类似地,一些新的主存储产品带有某种形式的重复数据删除功能,但我们将在另一个时间关注他们。因此,所有可以测量的市场都是健康和不断增长的。
那么,有什么问题吗?
问题是有太多的细分产品和许多不一致的地方。理想情况下,我们认为应该有一个重复数据删除技术,应适用于主存储阵列、数据源、备份软件、备份的目标设备,和归档。而且数据应该在最早的点(最接近它的生成)被重复数据删除,并以缩小的格式运行在其整个生命周期。当它需要与应用程序交互或提交给用户的时候,它必须只能还原到它的原始形态。数据从组织内的一个地方移动到另一个地方不应该要求对数据进行还原。这意味着它必须以相同的缩小格式复制并存储在远程站点,它已经开始这样做了。重复数据删除在主存储、或者在“源”/“目标”进行于是成为了客户选择时的一个问题。无论如何,存储需求将保持在最低限度。
关于这个设想没有什么新鲜的。在过去的五年或五年以上,我们已经阐明这一设想。所不同的是,作为一个行业我们接近看到这一设想成为现实。可以肯定的是,它仍然不完整,但所取得的进展是非常好的。看看惠普宣布的名为 StoreOnce的存储技术,显示了作为“源”或“目标”的Data Protector(HP的备份软件)或者作为“目标设备(B6200)”针对其他备份软件产品。根据惠普的说法相同的技术将被添加到他们的主存储产品。
虽然惠普可能已落后于他人,特别是EMC,一举超越其他人之一大步。EMC已经做了很多工作,在过去的一年整合Avamar和Data Domain产品,但两种格式的定义仍然是不兼容的。无论如何,这并没有将他们从这个领域明确的领导者位置上赶下去。戴尔收购了Ocarina,这是一个压缩和单一实例技术,与重复数据删除不同,但表达出快速的意图将该技术扩展到一般的重复数据用途。Ocarina已经在发展一致的重复数据删除技术的道路上,可以应用在从主存储到归档,我们知道戴尔有一个公开宣称的目标去实现这一愿景。我们预计,IBM今天也在积极工作在扩展其ProtecTIER技术超越“目标设备”。Permabit公司已开发出重复数据删除技术可以通过OEM嵌入在任何级别。
这场比赛已经开始。我相信,我们比人们可能想象的更接近实现这一目标。当然,惠普已经无疑一举打破了一些障碍。但其他主要对手也不甘落后。EMC已在这个市场上先声夺人,仍然是被追赶的供应商。IBM是在做好其ProtecTIER产品线。戴尔可能曾经依靠转销EMC Data Domain的产品,但这一协议已经终止。因此,戴尔很快需要自己的产品。
对于IT关键在于端到端环境的可视化,并看看这项技术它是什么:一个关键的、有战略意义的、普遍的技术,当正确实施将有深远的CAPEX(资金投入),OPEX(管理支出)和竞争力的影响。