本文作者LAUREN WHITEHOUSE是企业策略集团的分析师。
沃伦巴菲特的评论:"只有当潮水退去,你才能发现谁在裸泳"。这个评论也适用于当前的经济危机。如今,有更多的组织和企业受到了很大影响并感到忧心忡忡。
虽然经济危机对许多人来说都是艰难的时期,但是这也是一个重新检验IT环境并寻找节支方式的机会。许多企业在裁员、压缩预算、推迟项目。不过,这并不意味着组织只能采取节支措施。现在,聪明的投资–关注于效率和成本节约–将能够帮助组织从经济危机中脱颖而出。
从IT上来说,数据中心环境可以在很多领域发现浪费和无效率的地方。其中一个需要检验的领域就是存储容量–无论是主存储还是二级存储系统。对于多数公司来说,数据都在以两位数的速度在增长,但是为过期数据购买新的存储容量是否明智?从另一个方面来说,现在哪些技术投资可以带来短期的ROI(投资回报率),以及更为重要的长期回报?
企业策略集团的四个数据生命周期阶段描述了数据优化的一些关键点。在生命周期模型中,每个阶段的数据都可以被描述为动态或持久、活跃或非活跃、在线或离线。
第一阶段 动态/活跃/在线数据在变化中,且经常被访问。
第二阶段 持久/活跃/在线数据无变化,但经常被访问。
第三阶段 持久/非活跃/在线数据无变化,且访问次数不频繁。
第四阶段 持久/非活跃/离线数据无变化,且很少被访问,适于在离线归档中长期保存。
各阶段数据所采用的架构、技术、时间和政策必须符合每个生命周期阶段的特征。这样做可以极大地提高效率,并反过来节省成本,更重要的是,优化存储环境。
第一阶段 数据必须保留在最快、最能容错的架构中,并实施最有力的数据保护政策。由于这些数据经常在变动,在每日基于文件的备份和磁盘之间的进行新的快照将有助于提供更好的恢复点。在本地进行数据镜像,以用于操作恢复,将数据离线复制,以用于灾难恢复,这些措施可以改善恢复时间目标(RTO),并减少宕机风险。二级存储上的重复数据删除可以延长现有存储容量的寿命,并减少新容量购买需求。
第二阶段 该阶段的数据和第一阶段的数据具有大体相同的价值–该阶段数据仍然被经常访问,因此要求一个能够确保弹性和用户持续访问的架构。不过,数据保护政策可以适当宽松一些。由于数据无变化,因此复制和离站复制的频率可以更小些。不过,最好还是使用基于磁盘的备份以保持RTO;重复数据删除可以为这一层带来明显节约–对于内部部署和离站存储以及两者之间的网络带宽。主存储容量优化(重复数据删除和压缩)技术也可以采用,特别是因为这种做法可以为二级存储优化带来更高的效率。
第三阶段 由于企业的大多数数据是处于该阶段,因此该阶段有许多可以改进并实现经济效益和操作效益的地方。由于该阶段数据的使用特征发生了很大的变化,随着数据迁移到低成本、低性能的存储平台(例如,将持久和非活跃数据迁移到一个活跃的归档层),与SLA(服务水平协定)相匹配的架构和流程也必须随之改变。无变化的数据不仅给主存储系统带来容量浪费和性能约束,而且还制约了备份流程效率。通过建立一个活跃的归档层,主系统的性能可以得到提升,而LAN(局域网)、WAN(广域网)、SAN(存储局域网)之间的数据传输流量以及数据保护系统的数据流量都可以明显减少。该层的单实例存储功能可以极大地减少存储容量需求,而且次文件层的重复数据删除可以进一步优化存储容量(无论是对活跃归档层还是二级存储)。
第四阶段 数据并不需要和前几阶段数据同样水平的架构或访问性。根据数据年龄或访问元代码,这种数据可以被移出活跃归档层,进入磁带、光学或可移动硬盘存储介质。这种数据的无变化、非活跃性质使得它不必再实施每日/每周/每月备份政策。设定这种新限制将给磁带处理机,以及物理介质和离站存储的成本节约带来益处。
这些概念只不过是从一个更高的角度解读如何通过存储政策和架构节约组织成本。组织可以增加二级磁盘存储(替代磁带),归档平台以及/或软件,重复数据删除,或压缩功能。这些措施和投资可以优化存储环境,为业务、成本和操作带来长期好处。