数据存储产业服务平台

Solidigm 122TB固态盘,竟需要一整块晶圆才能做成!

将一块完整的晶圆交给Solidigm,就能得到一块122TB的企业级SSD,这是目前已公开发布的最大容量的企业级SSD——Solidigm D5-P5336。

将容量从61TB提升到了122TB并不是简单的叠加。Solidigm亚太区销售副总裁倪锦峰表示,这一容量需要将一整张晶圆上的所有存储芯片封装进一块SSD,对SSD架构设计、芯片制造、封装测试以及可靠性验证都提出了更高要求。

SSD厂商生产这么大容量的硬盘,任何环节的疏漏就可能影响几周的产能,造成巨大损失。对用户而言,任何小小的质量问题,都可能会对数据中心的故障切换和数据重建带来巨大挑战。因此,确保产品的高可靠性非常重要。

为什么迫切需要这么大的企业级SSD

作为全球一线SSD大厂,Solidigm无需炫技来证明自己,之所以做这么大容量,是因为有非常迫切的实际需求,需求正是来自于AI技术浪潮。很多人可能想不到,大容量SSD甚至在一定程度上关系到AI能否正常落地。

AI在全球范围内掀起了新一轮算力基础设施的建设浪潮,数据中心里有了更多带有AI加速器的服务器,这些服务器给数据中心的电力供应和机房空间都带来了很大压力,为了缓解压力,很多数据中心都在用大容量SSD替换HDD硬盘。

具体而言,是用高密度的QLC SSD替代原来TLC和HDD混合存储方案。QLC SSD较低的能耗需求为AI服务器腾出了宝贵的电力预算。在一些地区,数据中心建设计划因为供电不足而被搁置,QLC SSD在电力有限的场景下就显得更为重要。

与此同时,高密度的QLC还能大幅减少机房空间占用。减少机房空间占用就意味着能存下原本存不下的数据。Digital Realty在欧洲的一项调查证实,缺乏足够的存储空间来存放AI所需的海量数据集,被企业列为影响AI落地的头号挑战。

Ocient是一家数据分析解决方案服务商,原来搭建一套4.41PB的存储系统大概需要10个机架的HDD存储,最大功耗超过202千瓦。而采用基于Solidigm QLC SSD的高密度存储方案后,机架位减少了70%以上,功耗降低了77%以上。

简而言之一句话,大容量QLC SSD在节省电力预算和节省空间占用方面的价值,给AI技术战略的实施带来了影响。非常多的企业迫切需要大容量SSD,以致于61.44TB的Solidigm D5-P5536成为市场上的香饽饽。

SSD可以针对AI工作负载进行优化

SSD除了可以缓解数据中心供电和空间压力以外,还能针对AI工作负载的数据存储需求提供非常有价值的优化。

上图展示的是AI计算集群在不同阶段的数据存储需求。数据摄取阶段需要较高的顺序写入性能,而归档阶段则对随机写入性能要求高。此时,大容量的Solidigm D5-P5336 QLC SSD都能很好地胜任。

在模型训练阶段,此时的GPU需要计算大量的用于训练的数据局,需要存储快速把数据给到GPU。如果随机写入性能不足,GPU就会有很多闲置时间,昂贵的GPU一旦闲置就意味着巨大浪费。

而且,训练过程中经常会出错而导致中断,为了避免从头再训练,通常都会创建很多Check-point(检查点,存档点)来保存计算的中间结果。如果创建检查点以及从检查点恢复的速度比较慢的话,也会让GPU多很多闲置状态。

倪锦峰表示,当需要较高性能,而对于容量要求不高时,基于PCIe 5.0的Solidigm PS1010/PS1030(TLC),基于PCIe 4.0的Solidigm D7-P5520(TLC),或者基于PCIe 4.0的Solidigm D5-P5430(QLC)都是很好的选择。

其中,Solidigm PS1010/PS1030是去年发布的主打性能的SSD,这款产品容易被忽视的优势其实是能效。实测数据显示,D7-PS1010在大多数AI负载下的性能/功耗比明显优于行业竞品,能为AI存储提供更强的性能和更低的能耗。

倪锦峰介绍称,随着AI计算性能不断提升,存储性能面临挑战,部分国内厂商已经不满足于只是把SSD用作缓存层。大容量QLC SSD提供了更具成本效益的解决方案,随着存储层级的演进,QLC SSD 有望在AI时代发挥更大作用。

2025年1月发布的DeepSeek-R1模型推动了大模型技术的普及,该模型能以极低的成本进行本地部署推理,还能利用RAG技术构建本地知识库,这对高性能和大容量存储 提出了更高要求,也为SSD在今年的发展提供了更充足的信心。

Solidigm正在引领QLC替代HDD的技术变革浪潮

作为一家有晶圆原厂的专业企业级SSD厂商,Solidigm有基于SLC的高性能、高耐久性的SSD,也有丰富的高性能大容量TLC和QLC硬盘。Solidigm从2018年就率先开始在市场上推QLC产品,目前已累计出货超过100EB的QLC产品。

2024年,倪锦峰就曾提到,部分用户先一步采用大容量的QLC SSD来替代HDD方案。因此,2024年也被称为QLC替代HDD的元年。而现在,大量互联网大厂都在大力探索落地HDD替代方案,越来越多创新方案也在采用QLC。

INONET是一家来自德国的工业计算机(IPC)研发和制造企业,在ADAS领域推出 InoNet QuickTray解决方案,这是一个可快速更换的数据存储托架,主要用于汽车行业的高速车载数据记录和后续分析。

通过使用30TB的Solidigm QLC SSD替换传统HDD,延长了测试车辆的行驶时间,能够收集更多数据,减少返回维修站的频率,从而降低停机时间。此外,Solidigm SSD具备卓越的抗震耐冲击能力,即使在复杂道路条件下依然能稳定运行。

伦敦动物学会 (ZSL) 发现,城市化导致刺猬等野生动物的生存空间受限,使得刺猬种群发展面临挑战。为保护这些动物,ZSL部署了摄像系统,每天采集超过1500万张图片,并利用AI进行数据分析。然而,庞大的数据量让原有计算和存储系统不堪重负。

为此,ZSL与PEAK:AIO联手,采用61.44TB的D5-P5336打造了高密度AI存储,同时结合英伟达DGX AI计算平台。在ZSL伦敦动物园的边缘数据中心提供了1.2 PB存储,还将图像预处理时间从3分钟缩短至30秒,极大提升了研究效率。

正睿科技是一家服务器和存储硬件开发商,该公司使用了Solidigm大容量QLC SSD打造了一套畜牧业生物基因数据存储解决方案,解决了传统分布式存储痛点,很好地满足了研究所构建单一、大容量数据湖的需求。

结束语

Solidigm以其创新的122TB企业级SSD再次证明了其在QLC技术和企业级存储领域的领先地位。

面对AI时代对数据存储的迫切需求,Solidigm不仅提供了更大容量的解决方案,更通过技术优化,为AI工作负载提供了强大的性能支撑。

可以预见,随着QLC替代HDD的趋势加速,Solidigm将在未来的数据中心和AI基础设施建设中扮演越来越重要的角色。

未经允许不得转载:存储在线-存储专业媒体 » Solidigm 122TB固态盘,竟需要一整块晶圆才能做成!