至顶网CIO与应用频道 09月05日 北京消息:eyeSight科技今日宣布,将与中国顶尖语音识别公司科大讯飞合作,致力于研究和实现智能语音和语言技术。eyeSight是一家提供嵌入式计算机视觉人工智能、深度学习,以及手势识别解决方案的领先创新企业。通过将科大讯飞先进的人工智能语音识别功能与eyeSight市场领先的人工智能计算机视觉和感应技术结合在一起,合作双方将联手开发出对电子设备最为自然的交互方式。
在交互方式领域,语音和计算机视觉形成了互补而非竞争的关系。只要处理得当,二者联合即可创造真正的自然交互,这将简化并扩展人们与设备的交流方式。从智能家庭、消费电子产品、机器人,到车载系统,都蕴含着巨大的潜在市场和应用空间。在产品中同时应用基于语音和计算机视觉的控制系统,例如手势控制和用户感知功能,用户将体验到更为即时和直观的控制,人机交互再也无需滚动菜单和屏幕,从而使设备更加智能和自然地进行互动。
“此次合作是一个撬动语音和语言技术发展的绝佳机遇。结合计算机视觉和手势控制技术,我们得以带来更加无缝的交互体验。”科大讯飞研究院副院长王智国说道。“eyeSight科技采取独特方式开发创新人工智能与计算机视觉解决方案,这与我们简化智能设备交互体验的追求完美契合。”
eyeSight科技的首席执行官Gideon Shmuel表示:“我们非常荣幸并且很高兴可以与科大讯飞进行合作。人们的交流主要就是通过声音和肢体动作完成的,因此,计算机视觉与声音的无缝对接将能真正使人们可以用最为自然的方式与身边的设备或界面进行互动。”
了解eyeSight科技更多信息,请访问www.eyesight-tech.com.
好文章,需要你的鼓励
美国多州和部分国家要求特定应用进行年龄验证,澳大利亚已禁止16岁以下用户使用社交媒体。新提案《应用商店问责法案》建议由苹果和谷歌负责统一验证用户年龄,而非各开发者单独验证。这将提升用户体验,用户只需向苹果或谷歌验证一次身份。凭借苹果在隐私保护方面的优势,该方案可扩展至Safari浏览器,为需要年龄验证的网站提供确认信息,而无需透露用户个人数据。
Meta AI首次发布多模态奖励评估基准MMRB2,专门评价AI同时处理文字和图像的能力。该基准包含四大任务类型共4000个专家标注样本,测试23个先进模型。结果显示最佳模型Gemini 3 Pro达75-80%准确率,仍低于人类90%水平。研究揭示AI评价存在视觉偏见等问题,为多模态AI发展提供重要参考标准。
AI编程助手Cursor背后的公司Anysphere宣布收购AI代码审查工具初创公司Graphite。据报道收购价远超Graphite今年早些时候B轮融资时2.9亿美元的估值。此次收购具有战略意义,将AI代码生成与AI代码审查工具相结合,可大幅提升从编写到交付的整体效率。Anysphere估值已达290亿美元,近期频繁收购,上月收购技术招聘公司,今年7月还收购AI客户关系管理初创公司Koala的团队。
快手推出的Kling-Omni是首个真正统一的AI视频制作系统,能够理解文字、图像、视频等多种输入方式,不仅可以生成视频,还能进行复杂编辑和推理。该系统通过三个核心模块的协作,实现了从创意理解到最终输出的全流程自动化,让普通用户也能制作专业水准的视频内容,代表了AI视频技术的重要突破。