数据存储产业服务平台

从首届MassStor100排行榜,看中国海量存储的发展

日前,由中国仪器仪表学会图像科学与工程分会联合天津市电子学会成立的“存储评测联合工作组”(以下简称“工作组”)发布了首届中国海量存储系统MassStor100排行榜。首次届榜单收录了包含政府、科研、教育、能源、医疗等十余个应用领域共计35套系统。在最终的排行中,来自中科曙光的ParaStor和海康威视的DS-A视频云存储分别以72.35PB、70.74PB的有效容量位列榜单前两位。

因势而谋,逐步建立权威存储评价体系

自“十二五”将大数据定义为国家战略起,我国已进入海量数据时代接近10年。发展到今天,业界的热点已围绕在“新基建”周围,5G、大数据中心等新型基础设施建设的加速推进,带来的结果是大规模海量数据的汇集。数据存储技术也成为信息领域的最重要的底层基础技术之一。

2010年以前,国内对存储系统、介质、器件和材料研究与开发均落后于国外,国内存储垂直领域整体充斥着国外的产品和技术。直到近10年,国内在存储系统、介质、器件和材料领域的技术和产品才有了较快的发展,其中海量存储系统现在已能与国外同类产品分庭抗礼,存储介质、器件和材料则在奋起直追。

虽然国内存储领域厂商众多,各类型产品的竞争力也在日益增强,但目前国内的存储行业和领域中,缺乏权威的第三方认证机构和统一的评测标准,即缺乏成熟的,涵盖存储系统、介质、器件和材料的测评计量体系。该测评计量体系的缺失,一方面造成了国内存储行业的无序发展,使得相关企业和产品陷入同质化低水平竞争,不利于牵引国内存储产业做大做强;另一方面使得科研界和产业界缺乏互动的桥梁,两者均在自己的圈子中闭门造车,科研界的成果无法起到指引方向的作用,产业界则在无序和同质化中不断内卷。因此,在国内建立一套权威的,涵盖存储系统、介质、器件和材料的测评计量体系,是有着重大的社会影响和价值的。

存储涉及计算机、电子、芯片、材料等多个领域,建立一个完整、权威的存储测评计量体系,需要各方广泛的支持,是长期的过程。因此,一个分阶段的、渐进式的建设过程,是合理和必要的。考虑到目前海量数据存储系统是我国“新基建”必不可少的基础设施,企业级存储的部署规模也从几十PB向几百PB的量级迈进。因此,中国海量存储系统的展示与排名,对众多行业的数据中心存储系统方案的规划与建设有着借鉴意义。故选择以海量数据存储系统的测评计量体系作为中国存储评测计量体系建设的切入点,逐步扩大至存储介质、器件、材料,最终建立完整的测评计量体系并进行长期演进。

多个维度,解读中国海量存储发展

本次榜单收录的存储系统研制单位涵盖曙光、海康、宏杉、云信达、英方等十多家国内主流专业存储及灾备厂商。通过对榜单数据进行不同维度的分析,可对中国海量存储系统在应用趋势、技术发展等方面形成整体印象。

从应用领域看,上榜系统共涵盖了15个领域。其中视频监控、卫星遥感、云计算/云存储和生物信息、气象环保作为典型海量数据应用场景,占据上榜系统50%以上的份额。特别是2020年的疫情防控工作中,科技抗疫彰显创新实力。随着生命科学、新药发现、新冠疫情传播研究及快速检测等应用的快速发展,加速了存储技术与生物科学数据领域的融合,也为存储行业在生物信息、医疗卫生领域的发展带来了新的机遇。值得注意的是,除上述典型海量数据应用场景外,区块链作为新兴领域也出现在首届榜单中。对数据存储和应用而言,区块链拥有去中心化、共识机制、分布式记账等核心技术和特性,保证了数据的不可篡改性,从而有效减低数据确权和交易成本,实现数据更畅通的交易与价值新生。2020年,区块链被国家列入数字经济新型基础设施建设的范畴,让存储技术与区块链应用的结合有了更大的发展空间。

从产品类型来看,参评系统中分布式文件存储、分布式对象存储和备份存储分别以66%、11%和 9%的比例占据前三位。随着云计算、大数据、人工智能、物联网、边缘计算等新技术在各行各业更加广泛的普及与应用,以文件和对象形式进行存储的非结构化数据急剧增加,根据IDC的预测,到2025年,80%的数据将是非结构化数据。分布式文件存储以其天然的高容量、高带宽、高可靠、易管理等优势仍持续作为据海量存储系统的用户首选。此外,在新数据时代,传统数据中心向云计算、大数据、人工智能转变,分布式对象存储将作为新的存储类型,技术不断升级,在备份归档、视频云、大数据分析等场景下,应用规模将进一步扩大,助力企业实现数字化转型。

产品系统的存储介质以机械盘为主,其中51%系统仅配置机械盘,40%的系统使用机械盘和闪存盘的混合配置。2018年之前部署的存储系统,使用的机械盘以4TB为主,占据38%的整体份额,2018年之后部署的存储系统多使用更大容量的硬盘,8TB、10TB、14TB均占据较大的比例。此外,91%参评的系统都基于X86平台构建,ARM平台、MIPS平台的占比较小。在能耗上,参评存储系统每PB可用存储空间的能耗绝大多数在3KW以上,部分甚至超过5KW,低能耗存储系统占比极低。

从本份榜单可以看出,收录系统对于新技术的使用相对保守,NVMe SSD、SCM等高性能存储部件使用比例较小,超大规模存储系统多使用SATA/SAS接口SSD匹配应用高性能需求。此外,存储系统的总吞吐量、节点平均带宽与国外同类型榜单公布数据相比相差不大,但IOPS存在一些差距,需要从软、硬件层面进行深度优化,已达到世界领先水平。

展望未来,对中国海量存储的期待

在MassStor100发布会上,工作组也对中国海量存储的未来提出了期待。首先是打造绿色节能数据中心。数字化时代,随着存储系统规模的不断增加,电力和能耗将成为数据中心面临的最大困境,数据中心产业已进入高能耗产业序列,存储系统需要通过软、硬件层面技术实现节能降耗的目的。其次,用更高性能释放数据动能。在5G、AI、云计算和大数据相关技术的驱动下,信息高速公路已经就绪,数据的实时交互、共享和处理分析应用将越来越多,需要通过SCM、NVMe等先进技术提升存储系统性能、释放数据动能。最后,是数据的全生命周期管理。海量数据的聚集催生对全数据生命周期智能化管理的需求,冷热数据根据需要在不同特性存储介质层自由流动,更低功耗、更长存储周期的蓝光光盘、磁带库等将成为冷数据存储的可选方案。

“作为中国海量存储首届榜单,2020年的数据收集工作受疫情、在线业务运行等影响,覆盖领域仍然不够全面。此外,存储涉及计算机、电子、芯片、材料等多个领域,建立一个完整、权威的存储测评计量体系,是一个长期的过程,需要得到各方广泛支持与帮助。” 存储评测联合工作组表示,“希望在各方的努力推动下,MassStor100排行榜能够长期、系统的举办下去,从存储技术、应用场景、行业需求等多个维度对中国海量存储系统进行全方位的展示,逐步建立一个更全面、更客观、更符合中国国情的海量存储系统评测标准。以通过专业化和规范性的引领,为用户选型提供参考依据;促进产学研各方优势互补,提升科研成果的市场转化率;加速中国存储产业从研发创新向产业领跑转变。”

未经允许不得转载:存储在线-存储专业媒体 » 从首届MassStor100排行榜,看中国海量存储的发展