亚马逊网络服务(AWS)最近推出了Glacier,这是为长期的数据保护而设计的低价存储服务。坦白地说吧,是用来存储那些用户再也用不到的数据。对于沉寂许久的存储工业来说,这个消息无疑是一枚重磅炸弹,激起了各方关注。
亚马逊的Glacier能干嘛?
所有数据的副本可以被分为两大类:生产或数据保护。用来生产的数据副本是活动的,易改变的(当然,是合理地变化)或者是归档副本(这时候数据内容是固定的,不再改变)。不过,我们有时也会忽略掉在同一个存储池中出现混合的数据。大多数的情况下,新的数据会被更有规律地访问,而旧的数据的访问次数则要少得多。即使在同一个数据池,数据之间也有不同,有的数据需要在几分钟甚至几秒的时间里完成访问(比如活动归档数据),而有的数据用几小时甚至几天来访问都没有问题(比如深层归档数据)。
Glacier的主要用途就是存储深层归档数据,也就是所谓的“冷“数据,这个领域很容易被人们忽略。固态硬盘很流行,吸引了很多人的关注,那是因为它所在的领域是”需要性能表现的数据“,但是那些”半死不活“的数据就不那么引人注目了。冷数据存储很重要,因为越来越多的数据被划分为归档种类(80%的数据被假设为固定数据),即使是这样,这其中的大部分数据要被”剔除“(永久删除),这种密集的工作不太可能完成。因而Glacier成为存储市场的重要组成部分。
亚马逊的Glacier能带来什么?
Glacier可以把需要长期保存的数据存储在公有云中——这其中的大部分的数据估计都不会再被提取出来了。AWS使用强大的256-bit加密术保护数据。这技术也使用在S3产品中。这表明亚马逊使用的数据保护技术可以被用在对象存储上。
坦白地讲,想达到亚马逊这样的数据保护程度对于大部分公司来说都是一个不小的挑战。举个例子吧,AWS把其服务架构建立在被称为“可用区域”的地方,东海岸的“可用区域”被亚马逊以地理位置划分的10个数据中心来支持。任何存储在“可用区域”的数据除了最初的原本外,还在两个设备中保有副本。很少有企业能有如此大的规模来实现这样的物理灾难保护水平。
是的,采用大范围的部署,可实现数据的快速转移。另外,这还方便Glacier把存储的各种各样的数据通通转移到公有云中,而且不会遇到什么瓶颈,从这个角度考虑,Glacier相当于固态的解决方案了。
使用者与Glacier始终保持联系
和Glacier的性能表现一样值得称道的是,它可以让用户(不管是个人还是大型企业)随时随地管理存储的数据。用户可以计划什么样的数据需要存储,在需要时如何恢复。
提前计划是有效利用Glacier的关键。对于那些可能被恢复的数据,把它们存储在特殊的归档文件中可能更有用。另外,Glacier不支持使用荒废的软件访问数据,这是长期数据保护的一个大问题。在这个领域,全球网络存储工业协会正在研究办法,能更好地存储数据。
Glacier的价格为每年每TB 120美元,这个价格可是相当低,估计也宣告了磁带的死亡。把数据存储到Glacier中不需要费用,但是提取出来需要。虽然它对磁带发起了挑战,但并不仅仅是因为价格低。
存储一直备受争议的地方是:内部存储VS公有云存储。对于那些不使用磁带的公司来说,Glacier是个很好的选择。它性价比高,存储数据更有效率,而且不需要前期的设备投入,人员培训等。对于那些使用磁盘备份,或有磁带基础设施的企业来说,Glacier也算是一个比较有吸引力的产品。磁带产品供应商们将要花大力气来说服用户,磁带的归档备份,无论是活动归档还是深层归档,都是值得拥有的。对于一部分用户来说,也要考虑自身的条件来选择什么样的存储方式,换句话说,磁带并没有死,只是面临着另外一种挑战。
总之,Glacier提供一种付款即可用的模式,使用户可以很清楚自己的投入,也可以很方便地计划消耗。而且,这个价格还是很有优势的。
亚马逊似乎很有先见之名,推出的完美解决方案非常适合消费级和企业级用户的需求。Glacier只是最近的一个例子。尽管现在私有云很流行,但是亚马逊却独树一帜,推出完美的公有云服务。
当然,公有云不能掌握所有的“云“世界(或许混合云会在以后异军突起,变成主流的形式)。但是它会继续壮大,侵占其它产品的领地,包括深层归档和可选择的备份解决方案。
Amazon的Glacier不会杀死磁带,但是也能引起磁带供应商的注意,现在亚马逊已近是公有云服务提供商中的佼佼者了。尽管Glacier并没有取代磁带的位置,但是现在来看,亚马逊已经取得另外一种胜利了。