应对“人工智能+”时代的算力需求,公共云应如何发展?
近日,国家信息中心信息化和产业发展部发布的《“人工智能+”时代公共云发展模式与路径研究》报告(以下简称《报告》),强调公共云已成为解决算力短缺问题的关键手段,为人工智能的大规模应用和快速迭代创新提供了坚实支撑。
应对“人工智能+”时代的算力需求,优刻得释放公共云强大潜力。
随着模型参数量和数据量的急剧增加,算力需求呈现出爆炸式增长,这对新型基础设施建设提出了更高要求,“云计算”逐步走向“云智算”。公共云通过虚拟化技术将计算、存储、 网络等基础设施资源进行高效聚合,对外输出融合异构算力服务,成为实现AI大模型大规模商业化的必由之路。
作为业界领先的云计算厂商,优刻得深刻理解公共云在人工智能发展中的关键作用,并积极响应国家“人工智能+”行动,不断探索公共云与人工智能的深度融合,致力于为用户提供灵活高效、安全稳定的智能算力服务。
1.为大模型研发提供千卡、万
报告提出,目前算力资源紧缺已成为制约大模型规模化应用的主要瓶颈,而公共云能够缓解人工智能发展算力紧缺的问题。当前全球领先基础大模型的能力遵循“规模化定律”,即模型参数量、训练数据和算力规模越大,模型效果越好。一般而言,训练全球领先的基础大模型需要调度至少上千、万张GPU卡的高效协同工作。
优刻得具备强大的公共云服务能力,并紧贴“东数西算”国家战略,自建了内蒙古乌兰察布和上海青浦两大智算中心,为用户构建安全可靠的大模型智算底座。优刻得智算中心内提供多款GPU算力资源,以算力租赁的方式,高效满足了基础大模型和行业大模型企业的应用需求。目前,优刻得智算中心已为知名大模型企业智谱AI建超千卡规模推理集群、以海量GPU算力助力AI绘画平台图蝇AI提升图片生成效率和质量。
2.突破算力供给边界,助力资源利用率提升
在我国高端算力芯片进口受限的背景下,破解我国算力瓶颈的关键路径之一在于提高既有芯片和产能的利用率。公共云一方面可以通过多租户的模式,显著提升硬件资源利用率,另一方面通过通过规模经济效应推动算力门槛降低。
为了进一步提升算力服务的智能化,优刻得充分发挥公共云平台的技术服务优势,推出了孔明智能算力管理平台。该平台具备卓越的调度能力,能够支持同构、异构卡的统一调度与管理,并提供多样化的网络接入方案。同时,孔明智算平台还拥有完善的故障恢复机制,确保大模型训练的安全性与连续性。基于孔明智算平台,用户能够便捷地构建和管理训练集群,实现计算资源的智能调度和优化配置。此外,优刻得结合英伟达GPU Direct Storage技术,自主研发了UPFS并行文件存储系统,大幅提升了存储吞吐能力,以综合提升算力使用率,确保模型任务的高效运行。
3.AI+云,加速推动千行百业的智能化应用
报告还提出,随着智能时代的云计算技术体系加速演进,单点技术竞争已升级为芯片、网络、计算、模型全体系技术综合能力的竞争。公共云为新一代人工智能技术进步提供了强大支撑,在公共云上部署大模型能够让用户更加及时地获取到大模型的最新功能和应用,从而支撑千行百业智能化应用。
优刻得凭借超10年的公有云服务经验和系统工程服务能力,赋能产业数智化发展。通过与大模型合作伙伴合作,共同构建MaaS服务生态,通过算法模型镜像市场能力,为企业提供灵活、易用、低成本的一站式模型定制服务,从而推动垂直行业领域的AI技术能力革新。针对数据安全性要求较高的领域,如政府、金融证券和医疗等,优刻得还推出了可私有化部署的大模型一体机。这种软硬一体化的解决案够接付客的本地数据中心,让大模型应用更加便捷、高效。
报告最后,还强调了“人工智能+”时代的公共云发展模式应遵循市场化供给、规模化经营、专业化运营、生态化发展的要求,以需求导向,完善服务生态优化服务供给;以应用为王,强化公共云服务效能升级,从而驱动整个智算产业的发展。
未来,优刻得将持续深耕智算领域,不断提升公共云的服务能力和智能化水平,并致力于先进智算中心的建设和技术创新,加快构建以人工智能为引擎的新质生产力,推动云服务生态高质量、可持续发展。