2023年,人类开启了生成式AI的元年。生成式AI激发了人们无限的创造性,全球几乎每一家企业、每一个组织机构、每一个职能部门都在思考如何采用生成式AI来改变自己的销售方式、财务管理方式、代码编写方式……
“戴尔科技集团也不例外,我们很快就找到了380个能够用上生成式AI的项目。” 戴尔科技集团全球首席技术官John Roese表示。
短短一年之间,人们见证了AI技术及应用的火爆,以及由此导致的算力紧缺,还有雨后春笋一般推出的大模型。在生成式AI的裹胁和带动之下,2024年,人类将自觉或不自觉地步入生成式AI的次年。
“ChatGPT和其他的生成式AI系统的崛起和出现,整个行业都在讨论和理解GenAI,并逐渐转向实践。GenAI乃至AI将继续主导2024年的题。”在这个关键的时间节点,John Roese 就明年技术走势发布预测并进行展望,为IT、互联网厂商以及更多的行业企业专业人士指引了技术路线和业务创新方向。他指出,与GenAI一道,零信任、边缘计算以及量子计算,将共同成为明年四大趋势。
趋势详解:挑战与机遇并存
John Roese认为,生成式AI仍将成为2024年的重点话题。不过,虽然Google、OpenAI、阿里巴巴等众多企业和机构陆续推出了生成式AI相关技术,但由于大语言模型的训练成本高昂,垂直行业难以直接将其投入使用。2024年,市场会逐渐懂得如何让这些AI系统进入业务应用阶段,让越来越多的企业借助大模型真正地产生生产力。
当然,要达到这一目标,企业正面对诸多的挑战。
其一是推理的信息基础架构及规模。也许需要数十万台服务器,以及难以预料的开发维护人员数量。大模型投入应用,意味着使用高科技的成本将从训练的成本转向运营成本。如何以有限的资源最大限度满足疾速增长的最急迫的那些客户需求
其二,在多云环境下,云提供商大都是在数据中心来提供服务。在实际环境中,数据并非完全存储在数据中心,而分散在工厂、在医院、在运行的车上……这就要求云服务商以及服务堆栈为每一个应用来构建自己的边缘,也意味着同一家用户将有众多的边缘、众多的数据孤岛。推理过程应该部署在何处来完成——是数据中心,还是在边缘?很明显,必须在客户最近的地方。那么,如何搭建一个统一的、共同的基础架构,其上既有软件又有硬件的编排,可以以软件定义的方式来支撑业务?
其三,当今的网络安全通常属于被动的反应型,当发生安全问题后,用户才会部署解决方案来应对,但悲剧往往已经造成。同理,当推理从数据中心走向边缘端,贴近制造工厂、运输网络中心和客户身边,风险就越来越大,需要的安全保护措施的模式和等级逐渐提升。没有任何人、任何企业是完全安全的,所有的人、app以及设备都需要进行识别和验证,发现隐患即实时阻止。这就是零信任。如何部署零信任以确保推理基础架构的最高度安全?
针对上述挑战,John Roese表示,这些在戴尔科技集团的产品组合中已经提供了理想的答案:具有性价比优势的服务器产品,已经能够用于训练和推理,系列创新型存储系统,已经用于生产阶段的AI;而在边缘侧,戴尔科技过去两年来发布的几乎所有产品都带有AI加速器,通过和包括数据公司在内的生态开展大量密切的合作,可确保打造和交付正确的基础架构来支持企业级生成式AI的应用。安全方面,戴尔科技已经在自己的边缘产品解决案中采取零信任政策。……
左手AI,右手量子计算
在John Roese看来,量子计算在明年就会发生,未来5年内还会显著发展。为什么他如此坚信认为量子计算和GenAI将会密不可分?原因在于量子计算的独特优势。他举例说,生成式AI是一个软件系统,它能生成解答各种问题的答案,但这都属于概率计算范畴。而量子计算具备无限处理数据的能力,在无限的回答中选择最好的答案。
“借助量子计算对GenAI进行优化,你将会发现GenAI将更加高效、运行得更好。也许你突然发现,GenAI比现在你所看到的快100万倍!” John Roese说,这一天不知什么时候会到来,但那时产生的影响和ChatGPT刚问世时给人们带来的惊喜是一样的!
需要指出的是,AI不仅与量子计算紧密融合,跟边缘也一样在彼此融合。
John Roese解释说,大量的推理都是将交易数据纳入到一个模型中,这在企业的生产环境中通常需要实时回应。但大量的数据往往来自边缘端,经过处理后再返回到边端,如果延迟过长,不仅影响业务运转,还会造成不好的体验。引入AI,不仅有效地化解效率难题,而且还能提升数据的安全性。
当越来越多的企业踏入大模型赛道,同质化、重复开发的现象日趋严重。大模型如何才能更健康更长久地发展?
John Roese很自豪地表示,当大部分的企业都没有和大语言模型打交道的时候,戴尔科技集团就已经在这个领域展开了探索和研究,并且富于成果。
例如,基于生成式AI的大语言模型对绝大多数企业而言都是一个全新的工作负载,现有计算基础架构很难支持。他建议,有需求的企业对现有IT基础架构重新设计,不断地调优。戴尔科技也因此推出了计算的新的类型——加速器计算,帮助实现数据集之间的连接。同时,针对业务需求对基础设施进行对应的投资,既避免算力不足,也防止算力过剩、产生浪费。
大模型成功应用的核心基础是数据的质量。一个好的数据生态系统是训练GenAI的关键,企业必须重点关注自己的数据集,解决它在哪里,来自何方,如何采集,什么格式,有否偏见等等问题。John Roese建议,必要的时候可借助其他的大语言数据模型来检测第一个大语言数据模型(LLM),在坏数据和好模型之间建立了一道防火墙,实现对混乱数据的有效清理。
John Roese强调,2024年将是AI大发展的第二年,而量子计算将进一步加速AI的落地。这一切,离不开更加先进的硬件,也需要把推理基础架构部署到正确的位置,推理必须要紧贴数据,零信任的价值只有在新的环境中才能最大化。
“从2022年11月如今,人类在AI领域的创新成果令人瞩目。”John Roese感慨地说,“AI已经成为整个宇宙讨论的中心,但我们也要注意到,2024年会有各种各样的技术通过互联互通、相辅相成来加速AI落到实地,第一批企业级的生成式AI的系统将投入生产和推理。”
全面拥抱AI,或被AI抛弃;戴尔科技集团的预测为企业、机构和个人,指明了方向。值得一提的是,12月11日至12日在北京举行的中央经济工作会议提出,要加快推动人工智能发展,开辟量子、生命科学等未来产业新赛道,广泛应用数智技术、绿色技术,加快传统产业转型升级。
聪明的你,一定能“嗅”出点什么来!