数据存储产业服务平台

Amazon SageMaker“工具箱”不是只有一把锤子

Amazon SageMaker是什么?

简单说,是亚马逊云科技推出的一个机器学习平台服务,转眼间,Amazon SageMaker已经落地中国区域一周年。

“前切后剁中间片,刀背砸泥把捣蒜,刀膛拍、刀跟开,刀头刮鳞最方便。”这说的是中国厨师一把刀,凭的是中国厨师高超的技艺,但是对于大多人来说,还是需要各式各样的工具。所谓千人千面,需要满足不同用户的需要。Amazon SageMaker也是如此!

“如果把‘Amazon SageMaker’比喻为一个工具箱,那么这个工具箱里不是只有一把锤子,而是一个特别全面的工具箱,不同的客户可以在里面选择最顺手的工具,。” 亚马逊云科技大中华区云服务产品管理总经理顾凡说。

面向机器学习应用场景,需要AI/ML“工具箱”足够强大,能够满足不同水平用户的需求。

先看一个淄博市热力集团有限责任公司(以下简称“淄博市热力集团”)利用机器学习服务的案例:

淄博市能源集团有限责任公司、淄博市热力集团有限责任公司党委书记、董事长汪德刚表示,“多年来,淄博市热力集团利用信息化手段改造传统供热,致力于成为行业标准的制定者和行业发展的引领者。通过与亚马逊云科技合作,借助人工智能和机器学习的能力创新,淄博市热力集团建成了基于机器学习和大数据分析的智能供热平台,实现了从传统供热向产业智能化方向转型。”

简单说,从热电厂到需要供暖的家庭,中间需要一次网和二次网,所谓站端和户端,其调控的策略受室外天气以及建筑保温等多种因素的影响,调控策略以往依靠人工来干预,需要大量的经验积累。

通过与亚马逊云科技的合作,借助Amazon SageMaker机器学习的平台,淄博市热力集团快速构建、训练和部署了机器学习模型,通过气象、工控数据、建筑物维护结构等数据的学习和训练,训练出来了最佳的供热模式,完成了传统供暖向智能化供暖的转型。

对于供暖这个传统产业而言,淄博市热力集团训练的这个智能供热模型,明显具有行业推广价值。

智能化供暖模型只是一个例子。

Amazon SageMaker工具箱还有很多训练好的模型。如Prime Video、StyleSnap和Amzone GO等。

这些模型大多与电商有关,主要来自于亚马逊云科技对于亚马逊电商平台的支持,从物流优化、购物体验,到基于Alexa智能语音体验,有大量训练好的模型。

“如果你要制造汽车,没有必要从轮子开始做起。人工智能、机器学习也是如此,没有必要从头做起,有大量训练好的模型,拿来使用就可以了。”顾凡说。

应该说,这些训练好的模式是AI/ML工具箱的内容之一,适合普通用户使用。

但还是有些用户喜欢DIY,或者没有现成的工具,需要自己动手训练,对此,亚马逊云科技也有适合的工具。

谈到应用的现状,上海音智达信息技术有限公司CEO孙晓臻指出:如今用户对于数据的期望不断提高,但对机器学习、数据分析效果的信心却在不断下降,所谓“结果二分法”。

“关键还在于能够增加营收,同时降低机器学习的成本。” 孙晓臻说。

“如今大数据和人工智能的人才招聘和培养不易,开发技术难度越来越大,越是在这种情况下,越是需要提高系统部署的效率,降低系统的运维成本。要让数据科学家的精力集中在业务上,没有必要消耗在系统的搭建和维护。”他继续补充说。

对于合作伙伴而言,使用Amazon SageMaker机器学习平台,基于Web的机器学习IDE开发环境,将非常有助于以上目的实现,也是Amazon SageMaker带来的价值。

在Amazon SegeMaker落地中国区域一周年之际,亚马逊云科技又针对SegeMaker新增加了7大功能。

1、Amazon SageMaker Data Wranger,简化机器学习的数据准备工作。通过该功能,客户可以将各种数据存储中的数据一键导入。Amazon SageMaker Data Wrangler内置了300多个数据转换器,让客户无需编写任何代码,就可以对机器学习用到的特征进行规范化、转换和组合。

2、Amazon SageMaker Feature Store,一个完全托管且专门构建的特征存储库,用于存储、更新、检索和共享机器学习特征。客户可以在其中存储和访问特征,以便更轻松地在各个团队中对其进行命名、共享和重复使用。

3、Amazon SageMaker Pipelines是业界首个针对机器学习专门构建、易于使用的持续集成和持续交付服务,通过编排和自动化提高机器学习工作的效率。借助该服务,用户可以大规模地创建、自动化和管理端到端机器学习工作流。

4、Amazon SageMaker Clarify让机器学习开发人员可以更好地掌控其训练数据和模型,从而识别和限制偏差并解释做出相关预测的原因。

5、Amazon SageMaker Distributed training libraries为训练大型深度学习模型和数据集提供了易用的方法,与现有分布式训练实现相比,以最高快 40% 的速度完成分布式训练,并且帮助用户减少手动实施数据并行和模型并行策略所需时间。

6、 Amazon SageMaker Model Monitor帮助客户时刻保持机器学习模型的准确性,它能够自动检测生产环境中部署的模型,并在检测到不准确的预测时发出警报,从而帮助客户维护高质量的机器学习模型。

7、Amazon SageMaker Debugger,可以通过实时捕获训练指标,自动识别机器学习训练任务中正在出现的复杂问题,例如梯度值变得过大或过小等。它可以实时监控系资源(例如GPU、CPU、网络和内存等)的利用率,帮助用户提高资源利用率,对训练过程中的资源瓶颈进行告警,让开发者及时调度资源,快速采取纠正措施,减少时间和成本浪费。

其中,针对机器学习数据的检测纠偏的功能,让人印象深刻,可在理解模型预测的基础上,防止模型过度取信于莫种类型数据。

此外,基于高性能机器学习推理芯片Amazon Inferentia的Amazon EC2 Inf1实例,也同期落地中国区域。

临渊羡鱼不如退而结网,机器学习也是如此!授人鱼,不如授人以渔,如今,Amazon SageMaker准备好了!就看你的动手能力了!

赶快行动起来吧!用好机器学习,让AI为业务创新赋能!

未经允许不得转载:存储在线-存储专业媒体 » Amazon SageMaker“工具箱”不是只有一把锤子