至顶网CIO与应用频道 09月05日 北京消息:eyeSight科技今日宣布,将与中国顶尖语音识别公司科大讯飞合作,致力于研究和实现智能语音和语言技术。eyeSight是一家提供嵌入式计算机视觉人工智能、深度学习,以及手势识别解决方案的领先创新企业。通过将科大讯飞先进的人工智能语音识别功能与eyeSight市场领先的人工智能计算机视觉和感应技术结合在一起,合作双方将联手开发出对电子设备最为自然的交互方式。
在交互方式领域,语音和计算机视觉形成了互补而非竞争的关系。只要处理得当,二者联合即可创造真正的自然交互,这将简化并扩展人们与设备的交流方式。从智能家庭、消费电子产品、机器人,到车载系统,都蕴含着巨大的潜在市场和应用空间。在产品中同时应用基于语音和计算机视觉的控制系统,例如手势控制和用户感知功能,用户将体验到更为即时和直观的控制,人机交互再也无需滚动菜单和屏幕,从而使设备更加智能和自然地进行互动。
“此次合作是一个撬动语音和语言技术发展的绝佳机遇。结合计算机视觉和手势控制技术,我们得以带来更加无缝的交互体验。”科大讯飞研究院副院长王智国说道。“eyeSight科技采取独特方式开发创新人工智能与计算机视觉解决方案,这与我们简化智能设备交互体验的追求完美契合。”
eyeSight科技的首席执行官Gideon Shmuel表示:“我们非常荣幸并且很高兴可以与科大讯飞进行合作。人们的交流主要就是通过声音和肢体动作完成的,因此,计算机视觉与声音的无缝对接将能真正使人们可以用最为自然的方式与身边的设备或界面进行互动。”
了解eyeSight科技更多信息,请访问www.eyesight-tech.com.
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。