自动分层存储:提高性能,降低成本?
论坛 发表于:11年07月22日 13:39 [转载] TT中国
实际上,大多数公司会同时使用两种类型的存储,以满足预算条件下的应用吞吐量需求。这实际上代表了分级存储,同时,分层的管理也归结为员工选择事实上的手动分层还是部署自动化地系统。随着数据存储环境复杂性的增加,数据的增长以及通常情况下对于存储的低利用率,长期采用手工分层管理的方法是很难想象的。
微妙的平衡:成本与性能
存储厂商在公布其AST解决方案的时候,它们都在兜售提高性能降低成本的理念。对于降低成本和提高性能两者之间的取舍,人们想知道是否他们已经发现了一条途径以消除物理定律。幸运的是根据牛顿的科学,答案是否定的。事实上,AST不能在降低成本的同时提高性能。它所能做的是在最低可能成本的情况下,提供应用所必须的性能。因此,这更像是在两个目标之间的平衡。
存储分层回顾
大多数IT人员都了解存储分层,但还是值得简短回顾一下分层的概念。层次是由基础介质的性能特性决定的。固态硬盘(SSD)和闪存归于tier 0层;像每分钟15000转的高速FC硬盘归于tier 1层;每分钟10000转的FC和SAS硬盘属于tier 2层;低于每分钟10000转的SATA盘属于tier 3层。这些并不是绝对的规则,而是通常的区分方式。
分层可以通过两种不同的方式部署。第一种是磁盘阵列内部的,在一个单独的磁盘阵列中安装了两种或两种以上的介质类型。第二种时磁盘阵列间的,安装了不同介质类型的磁盘阵列联系在一起,以方便数据移动。也有可能在同一配置中同时存在这两种方式的分层。
自动化分层过程
无论是存储分层还是自动存储分层,都不是新技术。事实上,惠普公司声称在1996年就实施了自动存储分层。然而,AST的应用一直比较缓慢。这是因为最早的部署需要付出巨大的努力来进行数据分类和开发控制数据在层间移动的策略。多数情况下,数据是基于时间进行迁移的,而这一般不是一个最好的评判因素。
现在AST的部署采用了精密的算法,根据厂商和设置的不同,计算使用数据的范围从4KB数据块到1GB数据块不等。计算是基于与其它区块相关的访问需求进行的,因为没有定义的“高需求”。数据可以在高需求期间被提升到更高的层级并在需求减少时降低层级。该算法的质量决定了产品的价值而块的大小决定了工作量是否合适。较小的块通常更适于随机I/O,而较大的块对于顺序I/O更有利。
老牌厂商和新兴厂商都能够提供AST的功能。一些新的厂商,例如戴尔康贝(Dell Compellent),已经把自动存储分层作为其产品架构的基石了。按照公司的Storage Center产品线和它的Fluid Data Architecture,它已成为唯一一个将AST整合到架构中的产品。Fluid Data Architecture按照2MB大小的粒度移动数据块。
同样,对于Avere Systems公司,AST在其FXT设备中也是一个必选的功能。但是,它增加了使用任意网络附加存储(NAS)或者JBOD盘阵作为tier 3层存储的功能。因此,Avere公司同时提供了盘阵间和盘阵内的分层。另外,Avere公司使用了其自己的文件系统,这给了它额外的方法在它的算法中来控制数据的移动。FXT是一个“一劳永逸”的模式,它不允许用户编辑移动的策略,尽管层可以单独进行扩展以配合工作量的变化。