至顶网CIO与应用频道 10月24日 北京消息: 10月24日,科大讯飞(首届)全球1024开发者节在安徽合肥滨湖会展中心隆重举办,讯飞首款成品级硬件平台MORFEI(讯飞魔飞)智能麦克风在活动中携手合作伙伴,开启全球首发。用MORFEI语音控制全息投影吸引了大量眼球,MORFEI演示情景剧更是成为活动关注的焦点,来自全球的AI兴趣爱好者、开发者和资深技术专家等共同见证了“AI联接”带来的跨界融合创新力量。
科大讯飞消费者事业群执行总裁于继栋宣布MORFEI首发
【开发者体验MORFEI】
MORFEI智能麦克风是科大讯飞为开发者匠心打造的第一款语音交互硬件成品开发平台,旨在让人工智能交互能力接入产品、系统更便捷,让硬件领域接入AI能力的效率产生飞越式提升。自6.28“万物一听”智能硬件发布会亮相以来,MORFEI就受到众多开发者追捧并迅速成为讯飞网红级黑科技产品。历经四个月,MORFEI正式面向全球市场开启预售,这将推动AI产业化真正进入快车道。
科大讯飞消费者事业群执行总裁于继栋在《AI连万物 共创新未来》的MORFEI首发环节阐述:“早在2006年行业发展之初,科大讯飞就已将推出高集成度语音合成芯片和语音识别模块,把核心语音技术应用于手机、玩具、机器人、银行、公交、客服、车载导航、教育等领域。2010年起,讯飞AIUI平台上线,全面开放人工智能能力,培育了大量人工智能开发者,也培养了用户习惯,激发了硬件行业的想象空间,为后续智能硬件的发展夯实了基础。当前智能硬件产业仍处于技术碎片化、平台碎片化、市场碎片化的发展阶段。手机在经过漫长的硬件和系统软件多样化历程,最后收敛到Android等几个大的平台后,移动互联网产业也得以大面积爆发。如今,讯飞为加快智能硬件产业的进化速度,推出了业界首款成品化硬件平台MORFEI智能麦克风,就是力图通过提供标准化的软硬一体的智能硬件平台,让开发者可以快速开发出个性化的产品并推向市场!“
MORFEI的功能优势:
1、创新升级,效率为王
人工智能产业高速发展,创新变革日新月异。MORFEI智能麦克风内部注入了讯飞全球领先的智能语音前沿技术,并以高度成熟硬件成品产品形态呈现,这使得开发者可快速开发应用,数小时内完成上线测试,数天内完成设备联调。换言之,即现有条件下需要耗时数月实施的人工智能行业解决方案,通过MORFEI仅需一周即可彻底完成,极大地缩减了开发者的人力成本和时间成本,也满足了智能硬件企业想要快速探测市场、攻占消费领域的迫切需求。
2、远场拾音,场景丰富多样
业界最精致小巧尺寸的MORFEI,直径仅65mm,同时搭载八麦的4+4双环空间结构,实现了空间全方位拾音的功能,可以做到5m有效的拾音距离,唤醒率超过95%。因为能在三维空间内全方向拾取声音的特征,MORFEI可被贴在墙上或天花板上,随心摆放,适应各种场景。
3、声纹唤醒,听音识人
声纹识别与唤醒词紧密结合在一起,唤醒之后立即可以辨别出用户身份。此功能可以满足上层应用对用户身份的强烈需求。主要可以用于用户权限控制,大大增强安全性;同时大大方便了对用户进行个性化分析,让人机交互更智能、更和谐。
4、标准协议、分体设计,接入更简单
MORFEI智能麦克风支持多种协议对接,包括蓝牙、Wi-Fi,而且底部留有Uart串口,可以快速对接其它智能硬件设备,为其提供语音交互的能力。分体式设计,分为MORFEI主体与底座,开发者可以根据自己产品的实际需要,设计开发自己的底座。例如在底部集成红外转发器,可以用来控制家电等设备。
5、语义开放,随心定义
在成品级硬件平台的基础之上,MORFEI智能麦克风还有强大的AIUI云端开放平台作为支撑, 为MORFEI提供了多种深度定制的行业技能和各种功能强大的第三方应用。
通过MORFEI智能麦克风与AIUI开放平台的结合,开发者可以快速的将自己能力或者内容,经过简单开发之后,基于MORFEI展现出来。
【MORFEI麦克风情景演示】
硬件平台首发 让更多开发者受益
从核心软硬件能力到平台开放资源,讯飞用人工智能语音技术引领和布局着智能硬件产品的发展,通过整合“终端+数据+内容+服务”等产业间资源,提供一站式人工智能交互解决方案,全面推动智能硬件产业正蓬勃发展。
1024发售当日MORFEI同步开启线上优惠,购买即可优惠1024元,语音交互开发工作更便捷。(官网链接:http://aiui.xfyun.cn/aiui/morfei)
MORFEI产品总监张良春表示 :“此次MORFEI的首发,表示我们始终与智能硬件行业站在一起,从开发者的角度去思考。讯飞在人工智能领域已经有了18年的深厚积累,一直促进着中国智能硬件的发展。可以预见,不久的将来MORFEI将全面提升行业解决方案的接入效率和产业化升级,为智能家居、酒店、机器人行业带来更多新的惊喜。”
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。