我们都知道亚马逊最早是一家只销售书籍的电商网站,到现在已经扩展到全品类产品销售。对于电商而言,推荐是至关重要的,2003年亚马逊第一次发表了基于物品的协同过滤算法,也正是这一次发布,对未来二十年大量的工程和项目都造成了巨大的影响。
亚马逊云科技大中华区云服务产品管理总经理顾凡表示,人工智能的使用让亚马逊在购物体验、物流优化、语音智能上都产生了革命性的变化。
亚马逊云科技大中华区云服务产品管理总经理顾凡
购物体验
改善购物体验中有一个有趣的例子StyleSnap,这是一款用于服装搜索的AI工具,女生看到杂志上的搭配想在电商网站上直接购买,但是却不知道输入什么关键词来进行准确的描述。有了StyleSnap,只需要拍照或者上传一张照片就可以和产品库进行比对,找到类似风格的商品,机器学习模型的难点是需要鉴别服装的风格。
大家熟知的Amazon Go也是亚马逊客户体验革命性提升的一个标志,顾客下载APP进入超市,挑选好商品,无需排队结账,直接走出超市,手机就会收到账单。做到这个过程其实是非常困难的,因为算法要识别多人在一个货架前挑选商品,真正将物品和顾客ID进行连接,以及相似物品的精准识别。
物流优化
在亚马逊网站购物之前,很多货品已经布置到距离你最近的仓库,这就是提前预测。最早亚马逊在预测上使用统计学,之后就开始使用机器学习和深度学习,现在每天可以预测上亿商品的购买需求。而且在仓库中物流机器人Amazon Robotics推着货找人的方式,可以快速提升人员在配货方面的效率。
顾凡指出,机器学习要做的就是在复杂环境下还要尽量准确地预测货品发出后几天能够到达,因为这和客户体验是密切挂钩的,如果预计是五天到达,结果八天到达,客户体验就会大打折扣。
语音智能
在智能语音上,大家最熟悉的就是Echo和Alexa,Echo是智能音箱,Alexa是智能语音操作系统,目前Alexa和Echo已经扩展到了80多个国家,支持14种语言,开发了9万多个技能。
这就是机器学习使用的最佳案例,当你和Echo对话时,首先会唤醒Echo,Echo会将语音转化成文字,通过机器模型进行语义理解,之后调取相应的技能,反馈结果,这背后都是机器模型的快速推理。
亚马逊在利用机器学习上有一个核心理念,即亚马逊+机器学习=客户体验的提升。上文提到的这些例子关心的都不是算法,而是解决哪种客户体验问题,进而思考机器学习是否是一个适当的工具和技术,
扶上马、送一程,赋能客户创新
“我们可以把亚马逊和亚马逊云科技想象成是一个飞轮。”顾凡表示,亚马逊给亚马逊云平台提供大量的使用实例和需求,亚马逊云科技产生的服务和产品又可以让亚马逊零售包括硬件部门充分使用起来,形成客户和平台的互动关系。
亚马逊云科技的服务拥有超过200多种,包括,计算、存储、网络数据库、分析、IoT、AI/ML和安全。目前全球有数以十万计的客户在使用亚马逊云科技进行机器学习,92%的TensorFlow云上工作负载和91%的PyTorch云上工作负载都在亚马逊云科技上。
顾凡认为,亚马逊云科技希望通过机器学习帮助开发工程师和数据科学家,而且在项目结束后仍然可以快速迭代、快速开发,规模化地产生数据模型的工具,这也是我们的AI/ML工具集理念:授人以鱼不如授人以渔。
工具集可以分为三层,顶层-人工智能服务、中间层-机器学习服务,以及底层-框架和基础架构,这样就可以给适合的人挑选适合的工具。
Amazon SageMaker是一个开放的平台,亚马逊云科技在AI/ML的使用使命是普惠,所以Amazon SageMaker的开放在于对机器学习框架广泛的支撑,除了三大框架之外,还可以支持客户自己的机器学习框架,如果已经有了自己的机器学习平台,其可以和已有的开源DIY机器学习集成。
今天Amazon SageMaker在医疗健康、教育、出行、工业智能、游戏、新媒体等各个行业都有不同场景的实践。在医疗行业,益体康利用亚马逊云科技机器学习服务快速构建智能远程心电平台的AI训练和推理场景,提升了模型训练的速度;在教育行业,叽里呱啦使用 Amazon Polly和Amazon EC2 P3实例,与人工智能与机器学习技术快速地构建具有逼真语音体验的在线学习平台,让儿童获得具有沉浸式体验的纯正英语发音学习环境;在工业领域,天和荣在开发即视通门铃产品的人脸识别功能过程中,采用了开箱即用的Amazon Rekognition,短时间内就为即视通平台增加了人形侦测、人脸识别等能力;在游戏行业,行者AI利用Amazon SageMaker开发了游戏内容过滤服务,对不恰当内容的识别率超过96%;在新媒体行业,大宇无限采用Amazon SageMaker开发了视频在线推荐功能,仅用三个月的时间就完成了整个系统的建设并承受了实际用户访问的压力。
扶上马、送一程,赋能客户创新,亚马逊云科技希望真正把机器学习能力交到每一位开发者和构建者的手中。
好文章,需要你的鼓励
研究人员基于Meta前首席AI科学家Yann LeCun提出的联合嵌入预测架构,开发了名为JETS的自监督时间序列基础模型。该模型能够处理不规则的可穿戴设备数据,通过学习预测缺失数据的含义而非数据本身,成功检测多种疾病。在高血压检测中AUROC达86.8%,心房扑动检测达70.5%。研究显示即使只有15%的参与者有标注医疗记录,该模型仍能有效利用85%的未标注数据进行训练,为利用不完整健康数据提供了新思路。
西湖大学等机构联合发布TwinFlow技术,通过创新的"双轨道"设计实现AI图像生成的革命性突破。该技术让原本需要40-100步的图像生成过程缩短到仅需1步,速度提升100倍且质量几乎无损。TwinFlow采用自我对抗机制,无需额外辅助模型,成功应用于200亿参数超大模型,在GenEval等标准测试中表现卓越,为实时AI图像生成应用开辟了广阔前景。
AI云基础设施提供商Coreweave今年经历了起伏。3月份IPO未达预期,10月收购Core Scientific计划因股东反对而搁浅。CEO Michael Intrator为公司表现辩护,称正在创建云计算新商业模式。面对股价波动和高负债质疑,他表示这是颠覆性创新的必然过程。公司从加密货币挖矿转型为AI基础设施提供商,与微软、OpenAI等巨头合作。对于AI行业循环投资批评,Intrator认为这是应对供需剧变的合作方式。
中山大学等机构联合开发的RealGen框架成功解决了AI生成图像的"塑料感"问题。该技术通过"探测器奖励"机制,让AI在躲避图像检测器识别的过程中学会制作更逼真照片。实验显示,RealGen在逼真度评测中大幅领先现有模型,在与真实照片对比中胜率接近50%,为AI图像生成技术带来重要突破。