数据存储产业服务平台

中科曙光张新凤:以分布式存储加速数字化转型

刚刚结束的北京冬奥会,综合运用了人工智能、超高清渲染、5G、8K等一系列高新技术,打造出了一场既恢宏壮美又空灵浪漫的视听盛宴。这些新技术的应用都离不开海量数据的支撑。

随着“十四五规划”的逐步落地,“东数西算”工程的全面启动,5G、AI、区块链等技术的应用与推广,数字化全面加速,必然带来海量数据的规模化聚集。

赛迪顾问指出,2021年存储销售额将以30%的速度增长,销量将达到20%的增速。整体上,存储整体的增长高于IT其他领域。

中科曙光存储事业部副总经理张新凤

“身处大数据的时代,大到国家的战略,小到个人的工作生活与娱乐,每个人每个单位都是离不开存储技术。”中科曙光存储事业部副总经理张新凤表示。

面对越来越复杂的IT环境和业务环境,用户对存储系统的稳定性、性能和弹性扩展能力有着更高的期待,传统集中式存储烟囱式的部署模式在扩展性和管理性上都遇到非常多的挑战,分布式存储备受市场关注。

分布式存储面临的挑战与曙光的对策

面对海量爆发的数据,分布式存储更加引人瞩目。当然,分布式存储本身也面临非常多的挑战。

首先是数据的海量。五年前,用户提出的PB级需求,这对厂商来说就是一个非常大的需求了。如今,数十个P的需求已经是常见,上百个PB的应用也屡见不鲜,有用户对存储系统未来能扩展到EB级已经提出希望。但是,海量不简简单单的是设备的堆积,对应的技术难度是指数级的增长。

其二是技术发展趋势快迅,5G、AI、区块链等技术应用到了从数据的采集到数据的应用到数据的分析,数据的归档全链条。这个过程对存储的要求是更多协议的支持,比如,在处理的时候用NAS协议,到分析的时候又是HDFS协议,到归档的时候更多使用S3,各种不一样的接口。

三是性能的极致优化、功能的深度定制是未来存储系统的支撑。如数据处理过程的采集,分析处理的多个节点并发,在归档数据的策略灵活性等。

曙光存储的实践顺应了解决海量数据增长的需求,在技术路线上,一开始就选择了分布式存储路线。

作为国内首批自研分布式存储的厂商,曙光从2006年就开始技术的积累,2009年推出第一代商业产品,当年在上海部署了16PB的系统,是当时规模最大的应用;2018年,给用户提供的单一系统达到了56 PB;2019年,曙光首次部署了100 PB的系统;2020年,曙光第一套200 PB的系统上线。

今年,曙光将有300PB的系统将很快交付给客户。

在对协议支持方面,曙光也一直在进行迭代升级。2009年,面对数据处理的应用,曙光推出了POSIX高性能的客户端协议;2013年,针对数据中心和云的综合发展,曙光升级为对NAS协议的支持;2019年,基于各个行业的云化需求,又完善了块的协议。现在,曙光ParaStor实现了对文件存储、块存储、对象存储以及HDFS协议的完全支持,几乎可以覆盖所有的应用场景。

“曙光已经积累了大量的技术,当市场需要的时候,就能以最快的速度推到市场上。” 张新凤表示,这一切,都是曙光基于对用户、对各行业的理解,根据市场的诉求进行性能优化、定制化更新,在用户应用过程中一步一步完善起来。

快速的响应市场需求没有捷径

在张新凤看来,快速的响应市场需求并没有捷径可以走,更多的是天长日久的积累和演进。这里面有几个非常关键的因素。

一是要有一个强有力的研发团队做支撑。这个团队需要具有市场考验过的存储系统开发经验,较好地把握前端市场需求,在转化为产品需求后快速研发设计,完成系统化的验证,通过这个闭环快速推出满足用户应用的产品。

二是对行业的深耕和理解。很多行业客户并不是特别关注底层的存储,问及它们对存储的具体需求,很多情况下的答复都说不清楚,顶多是可靠性要高一些,性能要好一些,寿命要长一些。所以厂商一定要比行业用户更了解业务场景的需求,快速抓到需求的痛点,避免陷进误区,帮助客户做更优的选择。

看好分布式存储应用前景

“分布式存储现在应用的场景越来越广。” 张新凤说。

张新凤(右)出席主题为“破解海量异构数据存储难题,成就数字化转型”的曙光技术圆桌派

早期分布式存储更多用在计算领域,因为要共享存储。随着数据特别是视频数据越来越大,云、大数据技术也得以应用,分布式存储应用越来越广泛。无论是手机里的音视频,还是影视制作、石油勘探等领域,背后都是大规模分布式存储的平台作支撑,而且可能是分布在不同地区的多个数据中心。

在行业方面,运营商对集中式存储的替代一直走在行业的前面。从2019年开始,曙光连续两年都入围了运营商分布式块的集采,支持运营商各种业务的运营。

把握“东数西算”工程带来的新机遇

“东数西算”是一个国家战略工程项目,肩负着东西数据中心协同发展,包括碳达峰、碳中和的历史使命。

张新凤指出,“东数西算”工程对数据存储的主要诉求有四个。

一是实现数据的有效流通。可能是在内部的有效流通,如从采集、存储到分析到归档,也可能是多个中心之间的流通。这对存储来说意味着多协议的统一支持。

二是对数据的智能化应用要求更高。就存储来说,对HDFS接口的性能也提出更高的要求。曙光2021年做了大量的工作,推出了原生的HDFS协议支持,可根据用户不同的应用,快速实现对新组件灵活的支持。

三是数据安全。要解决这个问题,首先要保证设备本身的安全。无论是硬件还是软件,采用国产自主研发的产品更加放心。2021年,曙光与国内科研机构和相关组织展开数据加密整体方案的集成化的研究,今年上半年将亮相的新产品在一些应用场景中解决全流程数据安全的问题,其性能也有很好的表现。

四是绿色节能。2022年,曙光将推出一套新的采用冷板的设计的液冷的分布式存储,这个一体化的液冷方案将有助于PUE的指标实现1.04。

总体而言,曙光已经针对“东数西算”工程展开了大量的基础准备工作,张新凤希望曙光在这过程中能为国家的数字化发展贡献自己的一份力量。



未经允许不得转载:存储在线-存储专业媒体 » 中科曙光张新凤:以分布式存储加速数字化转型