至顶网CIO与应用频道 09月17日 北京消息:Amazon.com(NASDAQ:AMZN)亚马逊旗下的亚马逊网络服务公司 (亚马逊AWS)今天宣布,已经将中文普通话支持增加到Amazon Polly机器学习云服务,它可以将文本转成逼真的语音,让用户创建对话式应用程序,创造新品类的语音产品。
知语是目前Amazon Polly提供的中文语音。Amazon Polly支持多种语言的多种语音,将其文本合成为语音。一些机构正在使用这个中文普通话语音新功能,增强客户互动应用、交互式语音应答 (IVR)、音频新闻,以及有针对性的语言服务。
从事在线教育的客户云南北飞科技有限公司(树鱼普通话、树鱼英语,SuperFishAI.com) 正在使用Amazon Polly中文普通话支持,提供高效、便捷、安全的交互式语言教学平台。
云南北飞科技有限公司总裁刘焱表示,“Amazon Polly帮助树鱼服务于生活在偏远地区的农村孩子,让他们有平等的机会学习和理解世界上各种语言。我们选择Amazon Polly有三个重要原因:声音自然,实时响应,易于集成。这大大提高了我们的产品质量和开发速度。”
Netvue Belle是深圳市天和荣科技有限公司开发的即视通品牌人工智能门铃,它服务于居家安全和智能家庭助理两个目的。通过Amazon Polly文本转语音和其它AWS 服务,当有人来敲门时,这款门铃能够进行连贯、自然的对话。
深圳市天和荣科技公司软件开发经理胡游乐表示, "作为一个领先的智能家居品牌,即视通努力将人工智能融入我们的产品中, 为房主提供更多的安心。Amazon Polly为多种语言提供逼真的语音,让我们能够扩大全球覆盖。我们可以选择理想的语音分发我们的语音类产品,适应许多不同的国家,服务更大的客户群。“
Amazon Polly使用先进的深度学习技术进行语音合成,听起来像真人发音,并且提供多种语言、各种自然发声的男性和女性声音。Amazon Polly从文字变成流畅的发音,使客户可以向全球受众交付高质量的语音输出。
可以使用Amazon Polly的完整区域列表请访问AWS Region table。首次使用Amazon Polly的客户,可以通过AWS Free Tier试用。宁夏西云数据科技有限公司运营的AWS中国 (宁夏) 区域将在几个月内提供Amazon Polly服务。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。