当下,生成式AI和大模型与千行百业进行了全面的融合,带来了自动驾驶、智能制造、智慧医疗等AI+创新应用场景,这些新的应用场景将加速传统产业向智能化的变革。千行百业的AI+创新应用带来了数据爆发式的增长,数据也呈现出来多源、多模态的趋势,在这样的大环境下,浪潮信息如何布局数据存储业务,应对新技术挑战和新应用发展的?
在AI+ 时代,原始数据呈现出多源多态的趋势,包括文本、图像、音频、视频等有感数据以及激光、毫米波、红外线等无感数据,会产生TB级乃至PB级多态数据,这一趋势给数据的存储、管理和应用带来了新的需求和挑战。
这些新的需求和挑战体现在巨量多模态数据、超大读写带宽、超高读写IOPS和全生命周期管理四个方面。姜乐果表示,随着训练模型从LLM(语言)、ALM(音频)、CV(计算视觉)、VL(多模态)到FMLM(混合模态),对数据存储的要求从PB级到EB级容量需求,从百GB带宽到TB级带宽的性能访问要求,同时还要求在多源异构数据之间实现快速转换与传输,实现生命的全生命周期管理,以及数据的安全可靠。
作为全球领先的IT 基础设施产品、方案及服务提供商,浪潮信息已经建立了面向大模型应用场景的整体解决方案。11月27日基于浪潮信息大模型整体方案的“源2.0”大模型正式发布,并全面开源,这也将会更好地满足企业大模型开发和应用的需求,推动企业的应用创新。
面对AI+时代多源多态的数据挑战,企业需要支持多种架构、具有持久性、灵活性的数据基础设施,来部署和实施生成式AI的创新应用。
浪潮信息存储一直秉持“分层解耦”的理念,提供从数据中心、硬件平台、大模型智算软件栈OGAI和基础大模型完整的全栈解决方案,以应对生成式AI和大模型时代的全面需求和挑战。其中解决数据多模多态需求和挑战的就是分布式融合存储平台。
浪潮信息面向生成式AI的分布式融合存储解决方案,结合生成式AI和大模型的数据采集、数据准备、数据训练、数据推理和数据归档的五个阶段,由同一套存储提供端到端的数据流支持流程,满足面向文本、音频、图像、视频、代码以及多模态和全模态的模型需求,具有极致融合、极致容量、极致性能和极致管理四大特点。
极致融合是面向海量、多源、异构非结构化数据场景,融合多种存储介质多协议实时互访互通、系统扁平扩展,可以用一套存储实现多模态场景应用;极致容量是从PB级到EB级甚至是ZB级,通过多种容量算法的加持,让存储空间利用达到最优,让客户的投资收益最大化;极致性能是通过对存储性能的极致提升,带来了超大带宽和超高IOPS,满足了生成式AI和大模型场景对存储的苛刻要求;极致管理是提供了闪存、磁盘、磁带、光盘四种介质,以及提供了热温冷冰四种存储资源,实现了资源的互通,可以实现数据全生命周期的管理。
姜乐果提出,在AI+时代,无论基于高性能文件、流式对象还是原生大数据的智能化应用,浪潮信息的分布式存储平台都将成为企业简化IT部署和实施生成式AI创新的关键支撑。
姜乐果表示,浪潮信息未来将会继续凭借自身的基础平台能力和源自JDM的存储“场景共同体”定制能力,持续将先进的产品、技术、解决方案带给企业,与客户和合作伙伴携手共行,帮助企业加快实现数字化转型和创新,加速实现高质量发展。