亢海峰:大数据时代的智能存储
阿明 发表于:12年12月26日 14:10 [原创] 存储在线
所 有这些存储功能,都需要计算的能力,要想知道什么是重复的数据,必须先要计算哪些块是一样的,你要想删除的话,就要进行大量的重复数据删除,也要进行计 算,分层的存储也要知道哪一些数据块热,什么时候热,怎么样迁移到对应的层次上,这些都需要用计算来感知。,现在的存储完全和以前不一样了不仅仅是一个仓 库需要更为智能,更为精细的管理员,需要管理的流程和方式,这都是需要运用计算来实现的。
通过计算来实现的存储看到可以达到什么样的目的,数据压缩可以节省80%的空间。数据重复删除的备份量可以减少95%,数据的精简配置大家可以释放40-60%的空间。通过计算能力的增强,将大幅度提升存储的有效性。
所以对于传统的数据中心而言,不断丰富存储的功能是大家解决很多问题的行之有效的方法,而这些方法基于存储的计算的能力,基于CPU所提供的智能化的管理和存储的能力。
那 么,未来的数据中心如何,在未来的数据中心里面大家看到其实有不同的数据,有一部分是实施业务的数据库在运行,还有一部分是长期归档的海量数据。“举一个 简单的例子,国外的某一个数据中心,或者国内的大网站,运营商,你走到他的数据中心里面,分不清哪些是存储,哪些是服务器,全部是标准的机架服务器,甚至 是密度更高的服务器,坏了怎么办,换下来,拿走。换新的。整个的存储服务都是靠软件+标准化的硬件来提供服务的。”
这些服务器集群拥有超 大的容量,大家可以看到达到百P甚至是上到EB的级别,所以在大数据的领域横向扩展的存储,也是未来的一个发展方向。过去大家都说存储是存储,服务器是服 务器。到了今天希望通过融合的架构,标准的架构,既可以做存储,又可以做服务器,唯一的区别是应用模式场景不同,大家采用的配置不同。对于性能需求大的, 配置更高CPU更大的缓存,对于存储需求较大的配置更大的硬盘等。
最终的目的,对各种应用模式和场景提供经济的高效的扩展平台。
如果大家采用更多的计算能力,大家完全可以用智能化的存储,减少四十到五十的存储空间,采用重复的数据删除可以节省95%的备份数据。
目 前英特尔不仅拥有存储、网络、计算、也拥有大数据分析,管理,安全等相应的解决方案、涵盖了大家在整个行业里面的方方面面。但是,因特尔的角色是跟大家一 起来共建这个生态环境,和前端有硬件厂商,存储厂商,软件服务器,行业方案解决提供商,一起携手将最好的,最优势的方案提供给客户。这才最终是我们的价值 所在。