至顶网CIO与应用频道 12月14日 北京消息:Strategy Analytics近期发布的研究报告指出,语音适合一系列物联网(IoT)应用,并且可以在各种垂直市场上发挥作用。
Strategy Analytics发布的最新研究报告《从Alexa到行业:语音驱动的物联网(IoT)机遇》指出了物联网语音的八大关键因素,其中包括:
语音在物联网中的应用涵盖从消费者到工业,再到医疗保健等各种垂直市场。 商业用例包括改进的客户服务和更高效的运营流程。
Strategy Analytics执行总监兼报告作者Andrew Brown指出:“物联网一直聚焦于数据,但随着诸如自然语言处理和语音到文本等技术的不断改进,将语音纳入并整合到物联网应用中的能力为人与人互动提供一种通用的方法。 事实上,最近苹果收购Shazam,突出了人工智能语音和声音识别的重要性。
Strategy Analytics高级分析师Matt Wilkins表示:“语音可以用于沟通和控制,并且在适当考虑适合用途的情况下,可以为用户带来更自然的体验。 在某些情况下,语音为用户提供了至关重要的‘解放双手’的体验,比昂贵的触摸屏具有更高的安全性和更低的成本。“
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。