在今天的数据环境中,虽然数据持续地保持着增长,但许多IT部门仍没有开始利用市面上大量可供选择的数据精简技术,诸如自动精简配置、重复数据删除和压缩技术。本篇概述了这些技术可以带给用户的种种优势,以及你可以采取的各个步骤进行数据精简。数据精简技术,从自动精简配置到压缩技术和重复数据删除,对于企业级IT而言并非什么新鲜的技术。那么为什么企业采取这些技术要花费这么长时间呢?有人或许会说这是因为采购方在等待合适自己的技术,不过实际的原因可能是他们只是不确定这些技术的使用效果。
在IT环境中,性能和容量利用率往往无法兼顾:当你改善其中的一种时,就会不可避免的削弱另一项。这项困境的一个经典案例就是压缩技术和主存储之间的矛盾——虽然你可以节省一部分磁盘空间,但该技术从整体上拖累了整个计算系统。随着时间的变化发展,数据正在不断增长,而相应的存储利用率技术却未有改善。即便服务器虚拟化从整体上改善了整个数据中心的效能,所浪费的磁盘容量空间仍在不断上升。这也就是为什么这么多人对存储系统中的自动精简技术如此着迷,该技术从根本上直接针对利用率的问题。
自动精简配置技术
针对数据大爆炸,自动精简配置技术也并非是万灵药。要部署一个高效的自动精简配置系统,要求从文件系统到操作系统的应用程序到存储阵列的紧密联系,而这样的沟通渠道才刚开始建立。
Symantec公司的Storage Foundation和VMware公司的vSphere是今天市场上仅有的基于主机的产品,可以主动地和支持自动精简配置的存储阵列进行通讯。诸如T10的归零存储块和SCSI UNMAP等可能在未来的操作系统版本涵盖自动精简配置指令,因为其采用了ATA TRIM技术支持固态存储驱动器(SSD)。
当然,即便是所有的操作系统和文件系统对于自动精简配置技术“准备就绪”,那又怎样呢?自动精简配置技术只是容量优化的一个方面,其并没有解决数据增长本身。每一个创建出的字节都要拷贝、备份并且归档。这一系列负面效应抵充掉了自动精简配置所带来的各项好处,因此,还需要有其它的方式。
重复数据删除和压缩技术
重复数据删除技术可以看成是一种特殊的数据压缩方式,在数据保护产品中得以越来越多的应用。绝大多数的备份系统和数据设备都支持这些技术,其中包括一些类型的重复数据删除技术。但在主存储端的应用效果如何?重复删除和压缩技术是否也同样有效呢?
只有少部分供应商开发了主存储设备的重复删除技术,其效能也错综复杂。虽然Moore的Law提供了充足的处理器资源来处理实时的重复删除和压缩操作,但这些存储阵列并没有介入数据的保护和归档阶段,因此所带来的好处也相对有限。简而言之,主存储优化技术只是针对了主存储本身,而非整个数据的生命周期。
不过即便如此,重复删除和压缩技术在存储容量弥足珍贵的情况下也非常有效。近期由Nimbus Data System公司、Pure Storage公司和SolidFire公司等推出的新兴的“全闪存”存储设备利用各项数据精简技术,如实时的自动精简配置技术、重复删除技术和压缩技术,配合高性能处理器和闪存芯片,使得其可以和传统基于磁盘的产品相竞争。并且有迹象表明主流存储供应商目前也都关注应用容量优化的闪存产品的可能性。
不过,在已有的存储系统中应用数据精简技术似乎收效甚微。数据精简产品对于受容量限制大的系统可以大幅提高其使用时间,不过并非所有应用都适合使用数据精简产品。在一些特殊的情况下,比如数字图像的办公文件存储,可能非常适合使用数据精简技术。采购者应当关注的是在“疯狂”增长的数据领域,而非在静态数据中应用这些技术。
数据精简技术在未来的企业级数据存储市场上可能变得日益重要。不过在今天其仍停留在一些边缘应用中,比如闪存存储和媒体文件存储。或许在未来某天我们会看到一个完全集成的“数据精简”的数据生命周期,不过肯定不是在今天。