NetApp 重复数据删除基础知识回顾
Carlos Alvarez 发表于:11年06月20日 17:49 [来稿] 存储在线
NetApp早在2007年就推出了重复数据删除技术,该技术可显着降低存储容量要求。利用NetApp重复数据删除技术可找到相同的数据块,在执行字节级验证检查之后,以引用单个共享块的方式将其替换,从而提高效率。该技术可删除位于相同卷或LUN中的冗余数据块,从而降低存储容量要求。
NetApp重复数据删除是NetApp Data ONTAP操作环境和WAFL文件系统(管理NetApp存储系统中的所有数据)不可或缺的组成部分。重复数据删除“在后台”运行,而与所运行的应用程序或访问数据的方式无关。此外,其开销极低。
人们经常会问及的一个问题是:“你们能节省多少空间?”,我们稍后将就此问题进行详细说明。但一般来说,节省多少空间取决于数据集大小及其包含的重复数据量。下面,我们通过亚特兰大Polysius Corporation公司的例子,来看看NetApp重复数据删除在企业数据与工程数据组成的混合环境中的价值。该公司从事新水泥厂的设计和老水泥厂的改进工作。
其生产方面的存储要求每年增长多达 30%。通过对AutoCAD文件、Microsoft Office文档及其他非结构化数据组成的混合环境执行重复数据删除,Polysius回收了47%的存储空间。有些卷中的数据减少了多达70%。最终,该公司推迟了新存储设备的采购,并且成功使备份数据在磁盘上的保留时间延长了一倍。有关详细信息,请阅读Polysius 成功案例。
NetApp重复数据删除的一些明显优势包括:
·在NetApp或第三方主存储、二级存储及归档存储设备上运行
·不依赖于任何应用
·不依赖于任何协议
·开销极低
·在NetApp FAS和V系列存储系统上都能执行
·逐字节验证
·既可用于新数据,也可用于以前存储在卷和LUN中的数据
·可在非高峰期运行
·与其他NetApp存储效率技术相集成
·使用SnapMirror或闪存时,可继承重复数据删除实现的空间缩减
·简单的评估工具
·免费
这部分的“基础知识回顾”介绍如何实施NetApp重复数据删除、最常见的用例、重复数据删除的实施方法等。
如何在Data ONTAP中实施重复数据删除
从本质上讲,NetApp重复数据删除依赖的是一项成熟的计算机科学技术 - 引用计数。过去,Data ONTAP仅跟踪数据块是闲置还是在使用。现在,借助重复数据删除,它还能跟踪数据块的使用次数。对于NAS和SAN配置,借助重复数据删除,单个块最多可引用255 次。文件不“知道”它们在使用共享块 - 在WAFL中进行记录能以不可见的方式管理这些详细信息。
图 1) NetApp重复数据删除的工作原理。