2014年12月2日,由中国软件行业协会、中国计算机学会、武汉国家光电实验室和国防科技大学大力支持,DOIT传媒和存储在线联合主办的中国数据存储年度盛会—— 2014(第十届)中国存储峰会今天在北京盛大开幕。作为中国存储产业的十年盛会,峰会以“掌控数据经济·重塑商业价值”为主题,邀请超过1500位学术界顶级学者、产业精英和企业用户出席,围绕数据经济和商业价值两大话题,从云计算、大数据、软件定义和闪存等四个技术方面举行一系列主题演讲和圆桌会议。
在上午的主题演讲环节,英特尔通讯和存储基础设施事业部(CSIG)存储部门(SD)总经理 Bev Crair女士带来了题为《英特尔探索存储革新之道》,以下是演讲实录:
Bev Crair:各位早上好!刚才一直讨论数据革命,所以我觉得我的幻灯片都应该修改了。我叫Bev Crair,我是英特尔公司存储部门的总经理。这里我想谈一下存储的革命。为什么会出现这样一种革命?这样一种革命的原因在哪里?一些行业做出了怎样的反应,另外英特尔可以做出什么?现在世界正在发生变化,刚才的几位发言人都在谈世界发生的变化,你们看到他们所举的这些例子实际上我也有类似的例子。
第一、信息的爆炸性的增长。IDC说,现在大概全世界有2ZB的数据在互联网上。到2020年,将会有44ZB的数据。44ZB的数据非常海量。为让大家更直观的了解44ZB的数量是多少我举一个例子:如果在每个人的细胞上面放一个字节,就意味着有44000万人,是中国人口的1/4,是Facebook用户量的1/2,所以管理这么多数据,将会是我们面临的最大的挑战,也是我们客户面临的最大挑战之一。
第二、数据的复杂性,不仅仅是信息在增长,数据类型不在仅仅是文本,还有视频、音频,社交媒体上的一些信息,所以人们对数据的处理方式也要改变,刚才万先生讲商业模式的变化可以把数据进行交换和交易,黎先生也提到怎么样在学术环境当中分享数据。所以我们处理数据的方式也发生变化,以前传统的存储方式也不够用了。
第三、云模式,不仅仅是云存储,而且是云服务的提供商。他们的规模特别大,所以现在一些做云服务的公司,他们的规模极其大,数据极其之大。
第四、安全性,不仅仅是加密的问题,而且还有关于确保谁能够用你的数据,或者这个数据是怎么样分享的问题。另外,政府是只把这个数据留给自己用,还是给大家一起用。因此,我们看到很多行业,很多企业都在谈安全性。
这四个因素推动我们客户的变化和行业的革新。现在所出现的,是当我们考虑数据的增长,以及管理数据的复杂性,以及人们让我们用数据做什么的这些事变得越来越复杂。数据在今天的基础设施当中所占成本不断的上升,每一个IT人员在数据中心当中需要管理的数据量要比以前高10倍,而且这样的一种发展方式是不可持续的。所以,我们希望在存储行业能够找到一种方法,能够更容易的管理这些数据。
下面我讲我们这个行业现在做什么来帮助客户。首先,智能存储。第二、横向扩展。第三、使用非易失性存储,第四、软件定义。
智能存储服务主要是以软件提高存储系统的效率,包括重复数据删除,实时压缩,智能分层和所有这些都是方法。存储行业都使用这些方法来增加存储系统的效率。另外一个新的就是分析,存储系统能够提供分析的能力。分析存储当中的数据,然后让新的应用加入,新的模块来加入。
第二、横向扩展。以前是单一的系统内部的网络,这样一个网络和系统是纵向扩展越来越多,但是这种模式无法持续,特别是在云环境下,因为这种模式不能够占用非常大的模块,我们需要横向扩展,而且需要产生规模经济的优势,而且更加廉价,更小的系统,而不是把系统做的非常大。
第三、使用非易失性存储。我们看到,构造传统硬盘如果实现1100万的每秒的输入和输出需要500英尺高,如果使用3D固态硬盘,它所需要的面积仅为4英寸。所以,大家可以想象一下,我们要建一个新的数据中心,而且现在数据越来越多,它的速度还是加速三倍,所以这样的优势和劣势可以清楚的看出来,这是我们行业的应对方法。
第四、就是大规模,非常复杂的软件定义存储。我们开始从硬件到软件的提出出色的灵活性和可扩展性,而且能够整合多种提供给供应商的解决方案,比如来自于惠普、来自于华为,在同样的一个软件,一个数据当中如何共同来生存,动态提供资源,也就是说,渐进扩展,就是增长一部分付一部分的费用,按需购买,从小开始建,建的越来越大,而且还可以通过协调多种系统实现无限的访问。
英特尔的贡献。
讲英特尔肯定要讲我们的处理器,我们的核心技术就是现代化的存储系统,核心就是处理器。我们加速处理能力,减少对于能源和电力的消耗。其中一个大家可能不知道,英特尔在存储部门也有一个存储相关的CPU,也就是我们在CPU当中有一些非常具体的标准,特别是关于存储所用的核心。比如说英特尔平台存储扩展,能够使英特尔存储加速。除了我们的一些平台和CPU,我们还提供加速库和DPDK。加速库非常有意思,我们通过非常典型的软件的优化,在这个存储环境当中,比如你有一个软件是数据的去重复化。每一个CPU将整个流程走一遍,发现用什么方法来加速一些算法,或者一些代码,或者组合代码,这些都是免费提供给客户的,让删除重复可以加速。我们有一系列的加速库帮助你们的软件加速,这些都是现在英特尔提供的。
另外,DPDK就是用于加密的,而且我们有相关的软件,如果使用我们的一些技术,我们可以使用硬件的加速你的存储系统,能够更快的分析,这就是存储系统的关键。
我想提醒大家的是现在总体拥有成本的变化。如果你使用固态硬盘而不是传统硬盘,在我们朝着更多以数据为基础的经济的发展过程当中,需要越来越多的数据需要离基础设施和网络越来越近,固态硬盘是我们未来可以预见的解决方案。随着固态硬盘速度越来越快,网络技术也需要发生相关的变化支持这样快的速度,而且需要有很多工作来支持面向存储的以太网,以及直接用于CPU的网络技术。
最后我们做了很多工作加速向软件定义存储的转型,我们研究OpenStack,我们也做存储的优化,而且还推动其他的无缝通讯接口的标准,我们也在推动这些标准的建设。这种无缝的通信接口的标准以及无缝的数据接口。因为我们相信标准不仅仅是让我们分享数据,而且我们也做很多工作,加速软件定义存储。
所有的加在一起,我们认为作为英特尔的存储资产是什么?大家可以看到,网络与架构,SSD,还有存储技术。我们在这里所做的工作,是希望能够为生态系统中的合作伙伴和最终用户提供一些参考,看看我们的架构可以帮助客户看到他们的问题是什么,帮他们解决问题。
举个例子,我们刚刚和新浪网做的项目,新浪面临的问题就是他们基本的商业模式是基于微博的。在微博上面,我们发微博,供大家阅读、访问,一段时间后没有人再读这条微博,这个微博就存储下来了,不能够删除,需要把它存储下来。所以,新浪现在所看到的就是他们的这些存储每年的增长是40%,这种数据模式增长是不可持续的,因为它的服务器还有存储能力需要不断的上升,怎么帮助我们使这个存储更加有效,我们共同做的项目将帮助他们将消费的模式进行了变化,而且将数据压缩也进行了变化,而且还有删除重复数据等等,而且改善了他们服务器的功耗,而且增加了他们70%的存储能力,功耗降低了40%。
大家想想,每年40%的数据增长,而且现在的能力是70%,也就是你的你的数据中心两年的增长,都不需要再买另外一个数据中心,这能够帮助新浪长期、可持续的发展。
另外我们跟奇虎360做的Hadoop,他们的挑战是Hadoop的性能,我们和他们合作,用我们的智能加速库来减少复制数据所需的时间,而且我们发现他们还需要再增加他们的这些编码和解码的加速,我也帮助他们提高相关的效率,就是他们的编码提升了45倍。这些项目的白皮书在网络上都有,而且还可以和我们交流我们是怎么做的,上面有很多信息。
总结一下,存储在计算机行业呈爆炸式速度上升,复杂性越来越高,而且对于IT的需求也不断变化。行业本身对它的响应,新的功能,新的技术促使行业加速变革。英特尔的产品能够为实现行业的变革提供基础。所以,大家可以和很多英特尔的团队合作,利用新的时代所带来的机会,非常感谢大家!