在《红楼梦》中,贾宝玉对林黛玉说:“任凭弱水三千,我只取一瓢饮。这句话的意思是美好的东西很多,只要用心好好把握住其中的一样就足够了。这也可以用来指导我们对亚马逊云科技2024 re:Invent大会的观察。
开发者的弱水一瓢
先说职业身份,如果是你开发者,最需要关注的当属Amazon Q,其中包括Amazon Q Developer和 Amazon Q Business,前者用于软件开发,如自动执行单元测试、生成和维护项目文档、检查代码质量和安全漏洞、协助调试和优化程序代码等功能;后者用于数据查询、分析和内容生成等,辅助数据驱动的决策。
Amazon Q与 Amazon QuickSight 集成,用于简化 BI 仪表板,以及软件开发的可视化。此外,Amazon Q还能连接多种企业系统,如 Salesforce、Google Drive、Microsoft 365 等,方便员工获取和处理企业内部数据。
如果关注Windows.NET、VMware和大型机工作负载的迁移和现代化,Amazon Q提供了转型迁移的功,缩短转型时间,降低成本,为转型提供便利。
大模型的关注者
生成式AI将影响、改变行业企业未来,都知道ChatGPT是采用Azure计算资源训练出来的,与此同时,Microsoft Azure也提供OpenAI ChatGPT新版本模型接入服务,那么,亚马逊与科技也提供大模型的接入服务吗?
亚马逊云科技新发布的基础模型称为Amazon Nova,包括Nova Micro、Nova Lite、Nova Pro和Nova Premier等基础模型服务,其中,Micro是文生文模型;Lite用于处理图片、视频和文字生成;Pro是多模态模型,追求准确性、性能和成本的平衡;Premier即将推出,是系列产品中最强大的多模态模型,适用于复杂推理任务。
亚马逊云科技不仅提供Amazon Nova自研大模型,同时也借助Amazon Bedrock提供100多个热门、新兴及专业模型的服务,其中包括Luma AI、Poolside模型,并对Stability AI进行了更新。这里的Bedrock并非 “网上商城”的概念,因为用户要想用好这些通用模型,还需要做很多的工作,例如模型的本地部署问题、垂直领域知识的完善,以及幻听的问题等,为此,Amazon Bedrock提供了低延迟优化推理、模型蒸馏、提示词缓存等功能和服务;支持GraphRAG知识库的构建,通过自动推理检查功能、多智能体协作等创新,增强AI安全性并推动智能体发展。针对生成式AI幻觉现象,Amazon Bedrock提供了自动化推理验证的功能,当幻听出现的时候,交由重新生成网络,生成新的内容。
你可以把Amazon Bedrock理解为一个AI开发工作流的平台,在安全服务的框架之内,选择多种模型或者API服务,借助工具开发企业级的业务创新和应用。
数据创新与实践者
如今,越来越多的客户不再孤立地使用不同的数据分析工具,而是希望能够将Hadoop 大数据、数据中台、数据仓库、数据湖,以及机器学习、生成式AI技术进行结合,综合利用这些手段来洞察的价值。针对这部分用户的需求,主要对应Amazon SageMaker服务。
不知大家怎么理解SageMaker,我的印象中这是个机器学习的平台,采用机器学习方法对用户所积累各种运行数据,生产数据,以及外部共有数据,进行对比、分析和预测,从而用于生产数据,从功能和性能上看,可以支持快速SQL分析、PB级大数据处理、数据探索和集成、模型开发和训练。
为了帮助用户更好利用机器学习技术,新一代Amazon SageMaker新增了Unified Studio、Catalog、Zero-ETL以及Lakehouse等新的功能组件,其中,Unified Studio用于查找、访问数据资源;而Catalog和内置治理功能用于确保访问的合规;Zero-ETL支持与SaaS应用程序的集成,客户无需构建复杂的数据管道,即可在Amazon SageMaker Lakehouse和Amazon Redshift中分析第三方应用数据。
在数据创新领域,也有很多用户更加熟悉、习惯各种数据库的信息检索和查询,如关系型数据库,以及文档、内存、键值、图数据库等专用的数据库,为此,亚马逊云科技提供多种数据库的服务,其中,Aurara是增长最快的服务。此次2024 re:Invent,需要用户关注的是一款全新的无服务器分布式SQL数据库Amazon Aurora DSQL,其中的重点在于多区域强一致性支持,这意味着数据服务实现近乎无限的可扩展性的同时,还能够提供99.999%的多区域可用性。其中的技术难点在于跨多区域的数据同步,仅时间点对齐就是很难做到的事情,对于同一个时刻,当我们将颗粒度放大到10万分之1秒的时候,那么各个区域的时刻并不一致,这就为某一时刻数据一致性带来的了难题。借助Time SYNC服务,在保证性能的前提下,Aurora DSQL解决了多区域数据强一致性的难题。
云基础设施的选型者
关注应用的同时,也会有很多用户关注算力、存储和网络等Iaas基础设施选型,这也是公有云服务最为基础的内容,作为公有云领导者,亚马逊云科技必定也会有很多的服务和创新,例如自研AI算力芯片方面,基于Amazon Trainium2的EC2 Trn2实例正式可用,较当前GPU实例性价比提升30-40%;亚马逊云科技推出了配备64个Trainium2芯片的EC2 Trn2 UltraServers服务器,提供高达83.2 Petaflops浮点算力,计算能力是单一实例的四倍。在大规模训练方面,Project Rainier集群率先实现了搭载数十万个Trainium2芯片的算力集群。据透露,采用3纳米工艺Trainium3芯片预计将在2025年末上线,其集群性能将提升4倍。
在数据存储服务方面,Amazon S3新增了Metadata元数据功能,实现元数据的自动获取和实时更新;推出S3 Tables存储类型,为Iceberg表优化用户提供方便和支撑。在网络基础设施升级上,亚马逊云科技推出了第二代UltraCluster网络架构,也称为”10p10u”网络,支持超过20,000个GPU协同工作,带宽达10Pb/s,延迟低于10ms,可将模型训练时间缩短至少15%。
在机房基础设施的升级上,亚马逊云科技通过简化电力分配和机械系统,确保数据中心99.9999%的可用性,其创新的”液体到芯片”冷却系统无缝集成空气和液体冷却功能,将机械能耗降低46%。在控制碳排放方面,有很多的技术创新。
亚马逊云科技大中华区产品部总经理陈晓建表示:“亚马逊云科技是全球云计算的开创者和引领者,我们不仅在云核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈进行全栈联动的大规模创新,也因为如此成为行业企业构建和应用生成式AI的首选,今年re:Invent全球大会的一系列重磅发布再次印证了这一点。”
小结
全栈联动大规模创新所带来的是让人眼花缭乱服务,同时者也增加了学习和应用的难度,有太多的内容需要消化,这应该是参与亚马逊云科技re:Invent共同的感受,既然如此,也可以换个思路,带着问题寻找答案,必有所获。当然我们也可以从re:Invent发布中获取灵感、思路,跟上时代发展步伐。