2024年4月24日,以“释放数据要素价值”为主题的2024数据基础设施技术峰会分布式存储技术与应用论坛上,绿算技术副总经理韩晖发表了名为“存力助推新质生产力”的主题演讲,绿算技术是存储界的新生势力,演讲探讨如何利用先进的存储技术提升新质生产力,推动企业和社会的持续创新与发展。
存力是新质生产力不可或缺的新引擎
数字经济时代,经济的发展与数据信息紧密相关,数据不仅是关键资源,还是推动数字经济发展的主要因素,如何把数据用起来,智算、超算、HPC和深度学习都是不可或缺的元素。而在智算领域,包含算力、运力和存力三个核心要素,其中唯有存力是直接与数据相关,数据存储对存储设备的要求,以及存储行业的发展,势必成为未来新质生产力高质量发展一个不可或缺的新引擎。
通过数据的采集、归集、分析,进行深度学习 “以存强算”,实现“数实相融”,即数字经济和实体经济相融合,从而推动企业政府的数字化转型、企业的精细化经营和高质量发展,从而进一步推动国家经济的发展。
但是做为新质生产力不可或缺的引擎——存力,在发展过程中,遇到 “拦路虎”问题,严重影响了IT存储产业的发展,成为卡脖子因素之一。近年来,信创产业蓬勃发展包括CPU、数据库软件、操作系统等,但是大家再提到信创产业的过程中往往忽略了一个问题,即在存储的生态链方面,我们可以看看机房的存储网络设备光纤交换机基本上都是国外的,智算里用的IB交换机也是国外,再加上美国发布2024年新兴关键技术清单又将先进算力里面的高性能存储进行限制,严重卡了我们的脖子,影响到我们的数据安全。
那我们有没有办法解决这个问题呢?目前RDMA over Converge Ethernet(RoCE)技术的出现打破了这一僵局。绿算技术恰恰就是采用这种技术中的一员,解决了存储设备的卡脖子问题,有幸为国家的信创事业舔砖加瓦。
绿算产品特性分享
绿算技术的GP5000系列产品,采用存算分离的架构设计理念,采用CPU架构,在一个2U的机架空间内,实现了单机设备的高性能,一代产品可达600Gbps的聚合传输带宽,高达1620万的IOPS,存取时延不高于20微秒,在单盘容量60T硬盘的支撑下可以达到1.5PB的容量,由于采用存算分离的架构,实现了“存算分离、以存强算的”的能力。
何为是以存强算?在AI和机器学习的应用中,GPU通常用于执行大量的并行计算,在计算过程中,存力的带宽受限势必影响前端GPU的利用率,绿算技术的产品具有超高的IOPS和强大的存储聚合带宽,这样可以通过高速的数据存取,提高整体GPU资源的计算率,因此是实现存算分离,以存强算的整体架构。
虽然我们的一代产品具有这么优秀的能力,但是我们并没有止步不前,而是加速创新速度,在此长河我们正式发布更灵活便捷的升级版GP6000系列,同样是单机2U大小,144GB/s的聚合带宽和3240万IOPS,用于满足更高性能的计算和大数据处理需求。
GP6000系列在设计上,从一代产品的推拉式引擎转变为二代产品的插卡模式来提高产品的灵活性。用户可以根据需要选择不同的带宽配置(从100G到未来可能的1.2T)。
数据安全方面,GP6000能在现有单机性能不太受损的情况下,配备数据加密卡、RAID卡增强数据在存储和传输过程中的安全性。
面对大数据传输中存在的如成本高昂和时间长的挑战,绿算还引入了数智魔方1.0数据传输解决方案,不通过网络传输,而是物理携带数据到智算中心,从而在保证数据安全的同时,显著提高数据上传速度。通过使用数智魔方1.0,用可将据输到数据处理中心,通过100G或200G端口直接连接至处理设备,数据处理完毕后,设备可以安全地移除,保证数据完整性和安全性。
小编在大会展厅看到了数智魔方,两个大号行李箱组装起来一般大小,未来的数智魔方还会更小更便携,可用于野外勘探等工作。
举个例子,从北京到上海机房数据传输,如果开通一个价格不菲1GB的专线,那么1PB的数据要传输92天,如果你采用绿算的数智魔方,把用户数据直接上传到魔方里,数据运输过程中不通过网络传输,然后通过火车或者飞机,直接将设备运输到智算中心,再通过100G或200G的端口直接传输到智算中心里的设备上,数据算完直接把设备拉走,数据没有任何丢失,而且数据使用也更加灵活。
还有绿算的并行文件系统,“好马配好鞍”,好的设备还需要好的文件系统,绿算技术并行文件系统出身名门,源自两代中科院计算所,实现了完全的自主可控,绿算技术除了自有的文件系统之外,也兼容第三方文件系统,包括国内外的商业和开源系统。这种开放的平台策略使得绿算的存储产品可以适配各种操作系统和文件系统,形成了一个全开放的生态系统,也和海光等国产芯片做了相关的适配。
国产化方面,绿算使用自研的传输芯片,支持数据的可编程处理和多任务并发处理,同时优化了功耗。并且引入物理不可克隆(PUF)技术的安全芯片,这种芯片用于物理链路加密,能提高数据在传输过程中的安全性,即使在移动存储设备(如数字魔方)中,硬盘被移除,数据也不会丢失。还采用了国产芯片开发的网卡,支持高达200G的带宽,以及低功耗技术,确保高效和节能的数据传输。
最后
绿算技术产品不仅在云计算和算力密集场景中得到了应用,还广泛应用于高校、科研院所的多种研究领域,如人工智能、超级计算、大模型分析、防震系统、卫星遥感和基因测序等,国科大数学系构建的小型高性能计算中心就使用了绿算的产品。这些技术和市场策略也彰显了绿算作为新势力厂商在存储技术领域的竞争力和发展潜力。