数据存储产业服务平台

浪潮存储孙斌:新数据浪潮下的新存储之道

在企业眼中,数据被视为如石油、如电一样重要的生产资料,面对汹涌而来的繁复多样的数据,原有的数据存储以及数据利用方式已经捉襟见肘,企业必须找到新的数据存储应对之道,在探索新的存储之道的路上,浪潮凭借多年来不断的创新和实践,已成为全球TOP级存储厂商,浪潮提出的“云存智用 运筹新数据”的理念值得关注和参考。

新数据时代

如果说,一切记录都可以用数据来表示,那就可以说数据始于结绳记事,数据的历史可以追溯到远古时代,数据记录的载体从甲骨文,竹简,羊皮,纸张,变成存放在磁带里,磁盘里,SSD里的0101,虽然变化一直到在,但不变的是,数据记录的信息其作用一直很重要。

数据信息的记录者,一开始只是人群中的少数,而现在每个人手机里能存储的信息量堪比图书馆。分析机构给出的数据说,过去两年来产生的数据是过去多少年来产生的数据量的总和,数据量以前所未有的速度在产出。

数据的产出者已经不仅仅是人了,机器也在不知疲倦地产生各种数据,最近的一组数据显示,机器产生的数据量已经超过人类活动产生的数据了,机器成为数据的主要生产者。此外,数据的类型也越发多样化,除了常规的各种文件数据,数据的数据(元数据)也越发重要。

从媒体到企业的决策者们,都将数据视为如石油、如电一样重要的生产资料,许多企业在思考如何在海量数据中找出有用的数据来做分析,以此来获取竞争优势,然而,一个残酷的数字摆在企业面前,只有5%的数据被分析利用了。

所以,在新的数据时代,企业必须找到新的存储之道!

新数据时代,对企业存储提出了哪些挑战?

企业首先要思考数据如何存储的问题,身处云计算发展上升期,数据要放在本地数据中心还是公有云上呢?

有调研数据显示,存储在云数据中心的数据量开始超过存储在个人终端中的数据,而且,去往云数据中心的数据量正在以更快的速度增长。然而,这样的情形不会在企业级市场复制,但上云的趋势是一致的。

企业用户不会一步就位把数据存放到云上,而会在考虑成本,隐私,安全等多个方面的因素然后在本地数据中心和公有云数据中心间做出权衡。这一过程中,本地数据中心的创新者和云计算的创新者不断探索新的边界,两者在试探中走向融合,最终要达到的效果是能让数据在云上和云下能自由流动。

要做到这一点,需要企业自有数据中心云化,存储产品技术要云化,各种应用要进行云化,需要面向数据的基础设施云化,存储系统中的应用更多地池化,总之就是用云的能力存储数据。

企业第二个要思考的就是如何高效地使用数据,不难想到,智能是重要的数据工具,要求企业应用具有智能化,用智能的能力使用数据。

作为在国内AI服务器市场占有率超过50%的服务器厂商,浪潮看到了AI应用上的变化,浪潮存储产品线副总经理孙斌在2019全球闪存峰会上表示,AI已不仅是创业公司、云服务商专有的技术,AI已经进驻需要图像、视频、语言理解等技术的传统行业,包括银行、保险、快递等等。

浪潮存储产品线副总经理孙斌

浪潮早就看到了智能的发展趋势,作为全球市场上都颇具影响力的存储厂商,浪潮在2017年以来就率先在业界倡导智能存储,提出了智能存储的三个范式:在运维上面提供智能化;用智能进行故障预测;把智能技术应用在存储软件栈上,让应用找到合适的存储类型。近几年来,企业级存储厂商打造新的智能存储方案时也都遵循了这三个范式。

服务器以及存储的智能化只是实现智能的一步,只是基础设施层面的变革,最用户来说最直接,最重要的还是应用的智能化。

孙斌将应用的智能化发展过程总结为四个阶段,第一阶段是处理像机器翻译这样的通用问题,第二阶段是进行不确定性的和推理,第三阶段是做特征映射,第四阶段就到了数据时代,这个时代深度学习开始流行,可以自动进行特征抽取。

应用智能化的四个发展阶段对存储的需求也在变化,最开始要解决存不存的下的问题,然后又多了一个取得够不够快的问题,数据的增长速度太快以致于数据的处理能力捉襟见肘。

孙斌总结道,用户对于存储的要求也在不断变化,包括IOPS和延迟两个方面:

IOPS方面。以前用户只是简单追求IOPS,追求用同样的资金购买多少个IOPS(IOPS/$),已经演变到了在每TB空间里面能提供多少IOPS(IOPS/TB),考虑每瓦特能提供多少IOPS(IOPS/Watt)。

延迟方面。智能应用对存储的要求以前是1毫秒级别,后来变成0.1毫秒的级别,现在追求微秒级,智能应用现在越来越关注延迟,闪存存储的发展让延迟优化变为可能,从介质层到接口不断优化,这种优化后人们愕然发现,CPU和软件堆栈成了瓶颈。

浪潮的新存储之道——云存智用 运筹新数据

在存储需要云化和智能化的时代,作为一家全球市场TOP5的存储厂商,浪潮如何打造下一代产品方案呢?

2019年,浪潮提出了新的存储之道——云存智用,运筹新数据。顾名思义,就是用云计算处理数据存储的问题,管理好各种各样的数据,在用户的本地数据中心,帮助用户解决整个存储资源的池化、云化和跨数据中心的数据流动的问题,用智能的能力使用数据,用智能的能力管好存储。

具体而言,浪潮发布两大数据中心级存储平台(新一代G5存储平台和分布式混闪存储平台),新一代全闪存储HF系列,以及全新自研的NVMe SSD,从设备层,到系统层到数据中心级都有全新方案推出。而且在数据管理系统,重删压缩、智能数据分层等高级存储功能,异构管理等方面均有许多创新和优化,为我们展示了一家TOP存储厂商的存储之道。

其中,新一代G5数据中心级高端存储平台AS/HF18000G5面向的是关键应用,覆盖包括在线数据事务处理OLTP、存储整合consolidation、服务器虚拟化等场景。高端存储基于高可靠专业存储级硬件、软件架构share something,支持数十节点纵向和横向扩展。

数据中心级分布式存储平台AS13000 G5面向的是弹性融合云,覆盖大数据离线/实时在线分析、容器、AI/ML、HPC、备份归档等场景,基于标准商业服务器打造,属于软件定义存储方案,扩展性方面支持成百上千的单集群横向扩展,融合边缘、专有云与公有云,使数据在云上云下双向自由流动。

新一代HF系列NVMe全闪存阵列在架构和性能上做了全面闪存优化设计,使其具备领先的架构和领先的性能,以高端全闪存储平台HF18000G5为例,架构上,HF18000G5一套架构同时支持NVMe和SAS两种协议,系统互联架构全面升级为PCI-e,最大可以支持48个控制器;在性能上最高达到1500万IOPS,平均时延小于0.2ms。孙斌表示,预计今年四季度会有早期客户接触到该产品。

令笔者颇感意外的是,今年浪潮也发布了自研的NVMe SSD。

一方面,浪潮的SSD给超大规模数据中心用,给互联网公司用,浪潮过去十年来积累了与客户一起研发、设计、生产、制造、交付和供应服务器的经验,孙斌认为,这一做法可以拓展到SSD业务上。

一方面主要也是为了打造全闪存阵列使用,孙斌表示,2016年开始做全闪NVMe存储系统的时候,浪潮就认为盘控联合将会成为重要的技术趋势,只做系统不做盘,系统优势不能够得到充分发挥。在浪潮看来,做SSD是做好全闪存存储的必要条件。

一个数据中心,一个管理平台的说法非常具有吸引力,在管理性,在数据中心运维效率上,为业务带来的价值都不难想象,具体而言,浪潮通过统一的数据管理来管理用户多个数据中心,通过AI的能力做故障排查,进行系统配置,进行日常维护以及辅助决策。

所有存储厂商都在思考如何提升数据使用效率,浪潮通过实时无损在线重删压缩和智能分层技术不断提升使用效率,浪潮存储的压缩数据采用8Byte对齐,压缩空间利用率能达到99.8%。通过分层识别热数据算法自动将数据分散在SCM、TLC、QLC以及磁盘四个层次,既能保证核心应用业务数据响应,又能有效削减成本。

结语

浪潮一直以来的创新换来了市场上的空前成功,浪潮作为创新的存储厂商,在新的数据爆炸的时代,抓住了新的发展机遇。

孙斌介绍说,过去一年来,浪潮存储的PB级客户覆盖行业已从点线到面,PB级客户的数量同比增长150%,重复购买、扩容超过40%。此外,浪潮全闪销售收入增长超过200%,在中石化、邮储银行等关键应用广泛部署。

IDC发布的2019年Q1全球企业存储系统市场跟踪报告中,浪潮存储与IBM等厂商并列为全球市场第五,发展势头迅猛,充分说明了浪潮近几年来在闪存存储,在软件定义存储,在面向云环境的存储以及智能存储方面的策略的正确性,市场执行上的正确性。

未经允许不得转载:存储在线-存储专业媒体 » 浪潮存储孙斌:新数据浪潮下的新存储之道