至顶网CIO与CTO频道 05月20日 北京消息(文/王聪彬):2017 年AWS re:Invent上发布了三款AI服务,其中一款就是Amazon SageMaker,这也是当年最有具有战略意义的产品发布,其将机器学习从面向开发人员的基础能力开放阶段推向面向包括数据科学家等多类角色的端到端快速应用构建阶段。
到了2019年AWS re:Invent,Amazon SageMaker又迎来6个更新,包括:Amazon SageMaker Studio面向机器学习的集成开发环境(IDE)、Amazon SageMaker Notebooks弹性笔记本、Amazon SageMaker Experiments实验管理、Amazon SageMaker Debugger调试与分析、Amazon SageMaker Model Monitor自动构建模型、Amazon SageMaker Autopilot概念漂移检测。
Amazon SageMaker全家桶的推出,进一步降低了企业在机器学习使用上的门槛,这也让工程师就可以做更多的事情,而不需要太多领域专家或者科学家的介入。
2020年,Amazon SageMaker终于正式落地中国,同时也包括了2019年的6大更新,中国企业将能够更轻松地构建、训练、调优和部署机器学习模型。
应用机器学习可以开启想象力
机器学习实际上已经存在了几十年或者也可以认为存在了几个世纪。机器学习的三个关键元素包括数据、算力、算法,而云计算为机器学习起到了关键的作用,因为云计算可以方便的提供大数据的存储、计算能力,又可以方便的分享算法。
从电商时代开始,亚马逊就非常关注机器学习。产品推荐、产品搜索、物流配送、送货机器人、智能助理Amazon Echo、无人值守商店Amazon Go等,都有机器学习的身影。
Amazon SageMaker是一项完全托管的服务,可以帮助开发者和数据科学家快速地规模化构建、训练和部署机器学习 (ML) 模型。AWS首席云计算企业战略顾问张侠博士表示,云计算和机器学习一体化后,AWS可以提供最广泛、最深入的解决方案。
AWS提供的机器学习服务分为三层,第一、基础框架层,支持几乎所有的标准框架,同时虚机提供各种实例,以及现成的亚马逊机器镜像AMI(Amazon Machine Image);第二、机器学习核心服务层,包括Amazon SageMaker Studio等六大主要功能;第三、人工智能服务层,提供通过深度学习开发出的专用服务,像Amazon Rekognition、Amazon Polly、Amazon Transcribe等。
可以说AWS提供了全栈机器学习服务,利用这些工具企业可以找到人工智能、机器学习所带来的创新点、突破点,并且能够自己全方位的把握机器学习的工具、手段、方法,为自己所用。
而且Amazon SageMaker可以应用在不同的行业和场景中,几乎想象力就是边界,很多场景都会随着时间向前推进。而在中国,像人脸识别的发展非常快,类似汽车牌照识别的应用能够快速的落地应用。
突破机器学习的0到1
在中国使用Amazon SageMaker获得改变的公司也不在少数。深圳大宇无限科技有限公司是2016 年初从豌豆荚分拆成立的一家移动应用程序开发公司,目前主力产品SnapTube月活用户突破1亿,日活几千万规模;Zapee聚焦于满足用户短视频,2019年11月突破了百万日活。
在SnapTube和Zapee中实现视频内容在线推荐,对开发团队带来了巨大的挑战,构建机器学习系统的整个流程极为复杂,需要大量的开发人员耗费很长的时间才能完成。
大宇无限机器学习技术总监苏映滨在选择机器学习上主要看重性能、成本、算法、丰富度、便捷性、服务等方面,同时也希望在平台之外还能提供一些人工智能的支持。
通过使用Amazon SageMaker大宇无限实现了机器学习从0到1的突破。Amazon SageMaker的内置算法只需要准备数据,仅用三个月的时间就完成了整个系统的建设,同时与自主构建模型相比,通过训练阶段使用ECS的Spot Instance(竞价实例)能够节省70%的费用。
Amazon SageMaker还提供了非常多的机器学习框架,可以供大宇无限挑选、调试、训练。苏映滨表示,在实际业务中有很多不同的场景需要不同的模型,这就要求不仅要切换不同的算法,还要在不同的框架上进行尝试,如果自行搭建需要大量的时间和技术团队参与,Amazon SageMaker则为我们节省了时间和精力,并且提供了服务的稳定性。
未来大宇无限还将持续通过Amazon SageMaker满足更多内容推荐发展需求,包括:文本分类、图像识别、视频理解、推荐排序等。
作为AWS的合作伙伴伊克罗德也在基于Amazon SageMaker为客户量身打造AI解决方案,同时构建了技术模组,包含推荐系统、文本分析、自动化标签、语义理解、预测分类等。伊克罗德产品经理陈昶佑也相信未来结合Amazon SageMaker解决方案,能够将机器学习赋能给更多的中国客户。
好文章,需要你的鼓励
随着大语言模型在人工智能时代展现强大力量,可穿戴设备成为收集人体数据的重要载体。通过实时监测血压、心率、血糖等生命体征,结合AI边缘计算能力,医疗正向个性化转型。基因治疗、数字孪生技术让每个人都能拥有专属的医疗数字化身,实现从"报销型医疗"向"创新循证医疗"的转变,为疾病预防和健康管理带来革命性突破。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
在巴黎举办的欧洲开放基础设施峰会期间,专门用一整天时间讨论VMware迁移问题。博通收购VMware后许可证价格上涨,导致客户运营成本大幅增加。开源开发者展示了将VMware虚拟机迁移到开源替代方案的产品。Forrester分析师指出VMware客户对此感到信任破裂。OpenStack等开源解决方案虽然复杂度较高,但提供了健康的开源生态系统替代方案。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。