至顶网CIO与应用频道 09月05日 北京消息:eyeSight科技今日宣布,将与中国顶尖语音识别公司科大讯飞合作,致力于研究和实现智能语音和语言技术。eyeSight是一家提供嵌入式计算机视觉人工智能、深度学习,以及手势识别解决方案的领先创新企业。通过将科大讯飞先进的人工智能语音识别功能与eyeSight市场领先的人工智能计算机视觉和感应技术结合在一起,合作双方将联手开发出对电子设备最为自然的交互方式。
在交互方式领域,语音和计算机视觉形成了互补而非竞争的关系。只要处理得当,二者联合即可创造真正的自然交互,这将简化并扩展人们与设备的交流方式。从智能家庭、消费电子产品、机器人,到车载系统,都蕴含着巨大的潜在市场和应用空间。在产品中同时应用基于语音和计算机视觉的控制系统,例如手势控制和用户感知功能,用户将体验到更为即时和直观的控制,人机交互再也无需滚动菜单和屏幕,从而使设备更加智能和自然地进行互动。
“此次合作是一个撬动语音和语言技术发展的绝佳机遇。结合计算机视觉和手势控制技术,我们得以带来更加无缝的交互体验。”科大讯飞研究院副院长王智国说道。“eyeSight科技采取独特方式开发创新人工智能与计算机视觉解决方案,这与我们简化智能设备交互体验的追求完美契合。”
eyeSight科技的首席执行官Gideon Shmuel表示:“我们非常荣幸并且很高兴可以与科大讯飞进行合作。人们的交流主要就是通过声音和肢体动作完成的,因此,计算机视觉与声音的无缝对接将能真正使人们可以用最为自然的方式与身边的设备或界面进行互动。”
了解eyeSight科技更多信息,请访问www.eyesight-tech.com.
好文章,需要你的鼓励
阿里纳德数据中心与Calibrant Energy合作开发首创电池储能系统,通过绕过传统电网升级时间线,使俄勒冈州希尔斯伯勒在建数据中心园区提前数年上线。该31兆瓦、62兆瓦时储能系统计划2026年投运,将作为响应电网的动态资产,在需求高峰期放电,增强区域电网可靠性。这标志着美国首次使用专用电池系统加速大型数据中心并网。
威斯康星大学研究团队开发了LUMINA系统,专门检测AI在回答问题时的"撒谎"行为。该系统发现AI有时会忽视提供的参考资料,固执地依赖内部知识生成不准确回答。LUMINA通过监测AI对外部文档和内部知识的依赖程度来识别这种行为,在多个测试中达到90%以上的准确率,比以往方法提升13%,为构建更可信的AI系统提供了重要工具。
微软在Edge浏览器中推出增强版Copilot模式,提供更强大的AI代理功能,目前在美国进行限量预览。该模式包含Actions和Journeys两大功能:Actions让浏览器能代表用户执行任务,如语音控制打开网页或查找文章特定内容;Journeys则记住用户浏览历史,帮助用户继续之前的研究任务。此举正值AI浏览器竞争加剧,OpenAI推出ChatGPT Atlas、Perplexity发布Comet、谷歌集成Gemini到Chrome。目前Chrome占据71%市场份额,Edge仅占4.67%。
这项由法国CentraleSupélec大学领导的研究通过严格控制的实验,系统比较了AI的推理训练与传统训练方式。研究发现推理训练在数学、开放式任务中效果显著,但需要70亿参数以上模型才能充分发挥优势,且成本增加明显。研究为AI开发者提供了明确的应用指导,有助于根据具体场景选择最优训练策略。