数据存储产业服务平台

存储管理必知 重复数据删除应用解析

IDC、Gartner、ESG等全球知名分析机构的研究结果均显示,未来四年的文件数据年复合增长率将达到55%.于是乎,前几年被热炒的重复数据删除技术终将落到实处,诸多厂商都开始了宣传活动,摩拳擦掌准备抢占市场,作为企业的管理层,此时此刻也要清醒,了解基本概念,慎重在采购单上签字。

一、签字前我要考虑的几大问题

安全问题:厂商提供的方案是否有潜在的风险,这个问题要自己反复斟酌,不要等着厂商的售前工程师主动“爆料”。

空间占用:究竟去重率是多少,厂商提供的数据是在什么情况下进行的测试,自己的IT环境能否达到这样的去重比率。另外要注意,在去重率已经很高的情况下,再提高,释放的空间是很小的,也就是说,意义不大。

备份、恢复等需要多长时间:是否会影响企业的业务。

成本:我要增加什么,我必须改变成什么,更换设备需要多长时间,是否会影响业务。

最后要仔细研究厂商给出的参数,尤其是有关吞吐量的描述。可能你实测的结果与描述会有不小的差异。

二、源端、目标端去重的选择

重复数据删除的选择最终取决于您希望在哪个环节实现对数据去重,以及您更偏好于在硬件层进行消重还是软件层。所以对选择什么方式没有统一答案。

厂商和产品

– 单独的目的端去重

Data Domain、Exagrid、Greenbytes、IBM、NEC、Quantum和SEPATON

– 集成在备份软件中的目的端去重

Symantec NetBackup

– 集成在备份软件中的源端去重

Asigra、Symantec NetBackup

– 单独的源端去重

EMC Avamar、i365 eVault和Symantec NetBackup

– 二者的混合

CommVault Simpana

三、在线和后处理去重的选择

在线去重即实时去重,后处理去重即异步去重。W. Curtis Preston在重复数据删除讲义曾列出管理层需要理解的几个概念:

管理层需要了解的在线去重技术

– 当备份完成的时候,去重操作也完成了

– 备份数据一旦写入就开始复制

– 后处理去重方式的厂商需要一个数据准备区域

– 使用后处理去重方式的厂商在备份完成之前不会开始去重操作,因此整个过程会比

在线去重的方式更长一些

管理层需要了解的后处理去重技术

– 当备份完成的时候,去重也基本要完成了

– 当第一份拷贝完成后复制也随之开始

– 我们等待的是一份拷贝的结束,而不是所有备份的结束,除非用户有这样的需求

– 数据准备区域允许我们:

初始备份更快

允许最新的备份和最近的恢复来自本地数据

允许去重交错进行

有选择性的去重

– 其实不一定需要那么多的数据准备磁盘空间

– 在线去重厂商可能会让大数据量的备份和恢复变得缓慢

他们对所有数据都进行了再水化,我们仅仅水化旧的数据

-使用在线去重技术

EMC Data Domain

IBM Protectier

NEC HydraStor

– 使用后处理去重技术

Exagrid

Greenbytes

Quantum DXi

SEPATON Deltastor

四、测试一切

在选择合适的去重设备之后,不要以为万事大吉,接下来要进行的事情对所有的问题进行测试。包括去重率、所以的运行速率、整体性能,等等。

重复数据删除是一项非常好的技术,但完整的解决方案对于企业来说更加重要,面对林林总总的产品和厂商,企业的管理者也需要擦亮眼睛,和IT经理一起坐下来认真分析哪种方式和产品更加适合自己的业务。不要花了钱却没有获得多少实际效果。

本文来源:http://club.techtarget.com.cn/space/viewspacepost.aspx?postid=3224&spaceid=267

未经允许不得转载:存储在线-存储专业媒体 » 存储管理必知 重复数据删除应用解析