至顶网CIO与应用频道 09月17日 北京消息:Amazon.com(NASDAQ:AMZN)亚马逊旗下的亚马逊网络服务公司(AWS)今天宣布在上海建立AWS人工智能研究院。这一举措是同期在上海举行的2018世界人工智能大会上宣布的。上海市正在打造成为全国领先的人工智能创新策源地,计划到2020年实现人工智能重点产业规模超过1000亿元[1]。
作为AWS在亚太地区首个人工智能研究院,AWS上海人工智能研究院将建立一个强大的本地存在,融入AWS全球的人工智能研究与开发计划,致力于打造AWS人工智能与机器学习的云服务,惠及全社会。
在AWS上海人工智能研究院,将会看到世界各地和中国本地的顶尖人才,包括卡内基梅隆大学领先的机器学习科学家、AWS机器学习和深度学习总监Alex Smola博士,加州理工学院电气工程系Pietro Perona博士和Allen E. Puckett教授,加州大学洛杉矶分校计算机科学教授、亚马逊人工智能应用科学总监Stefano Soatto,以及AWS机器学习首席科学家李沐博士。AWS上海人工智能研究院将成为一个包括研究人员、开发人员、工程师和技术项目经理在内的、功能齐全的团队,开展以中文为主的多语言自然语言处理研究,参与和开发开源深度学习生态系统,支持中国客户在机器学习和人工智能方面的应用落地。
AWS上海人工智能研究院与AWS遍布世界各地的人工智能研究院一起,聚焦于推进和发展深度学习算法及其未来应用。它将为AWS贡献于中国的开发者社区发挥关键作用,将提供多种工具,让客户更容易采用人工智能技术,构建模型并在深度学习生态系统中运行。AWS上海人工智能研究院还将培养中国新一代的机器学习人才,与中国的顶尖大学和研究机构协作推进人工智能研究项目,联合建设人工智能与机器学习研究实验室。
“亚马逊已经在人工智能领域持续投入20多年。在中国,我们与一些具有世界级远见的公司携手,例如图森TuSimple、氪信科技CreditX、汇量科技Mobvista、Hubble Connected和流利说等,他们已经在使用AWS机器学习和人工智能云服务来构建关键业务应用程序,”亚马逊机器学习副总裁斯瓦米?西瓦苏布拉马尼娜(Swami Sivasubramanian)先生表示,”随着AWS上海人工智能研究院的成立,我们将与AWS中国团队、中国产业界和学术界密切协作,帮助更多客户实现人工智能民主化,让先进的人工智能和机器学习技术惠及所有人。”
AWS上海人工智能研究院将由上海纽约大学计算机科学系教授、纽约大学全球网络教授张峥领导。张峥教授在大规模分布式计算理论与实践、及其与机器学习的交叉领域被公认为经验丰富的世界级专家。他拥有伊利诺伊大学厄巴纳-香槟分校的博士学位,是计算机协会成员,也是SIGOPS APSYS研讨会和CHINASYS研究社区的创始人。张峥表示:“非常荣幸加入AWS人工智能研究院,与世界上最聪明的一批人共事,我们有机会激发创新,让技术变得简单、快速、有用,服务于中国各种规模的企业和机构。“
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。