“讯飞星火3.5达到了预期。”科大讯飞董事长刘庆峰说。
通用人工智能必将影响人类的生产和生活已经不言而喻,这一年百模大战下来,我们需要的是在场景中发现价值。
今天,讯飞星火V3.5的到来,相比10月24日发布的讯飞星火V3.0实现了七大能力全面提升,包括文本生成提升7.3%,语言理解提升7.6%,知识问答提升4.7%,逻辑推理提升9.5%,数学能力提升9.8%,代码能力提升8.0%,多模态能力提升6.6%。
在多项核心能力上,讯飞星火V3.5已经逼近GPT 4 Turbo,在语言理解、数学能力方面超过GPT-4 Turbo,代码方面达到GPT-4 Turbo的96%,多模态理解后面达到GPT-4V的91%
科大讯飞同时也在进行自主算力平台的建设,2023年10月24日,首个支撑万亿参数大模型训练的国产算力平台“飞星一号”正式启动,讯飞星火V3.5正是基于此进行训练。
科大讯飞希望大模型能解决真实世界刚需,所以伴随多项原子能力共同作用,讯飞星火V3.5全新赋能万物互联时代人机交互。
通过科大讯飞研究院院长刘聪与讯飞星火的对话,讯飞星火V3.5表现出共情感,这是得益于语义理解、指令跟随、多轮对话、情绪感知、拟人合成的配合。
讯飞星火V3.5全新赋能知识学习于内容创作,集合了要素抽取、概念理解、知识推理、问题生成、图文生成能力。
像使用讯飞智文生成PPT后,想要在页面中增加图片,可以让助手给出提示词生成图片,PPT文字也可以进一步通过助手优化,并支持虚拟人对PPT进行讲解。
讯飞星火V3.5全新提升数智化生产力,集合了逻辑推理、时空推理、数学能力、代码能力、多模态能力。
科大讯飞最早就是以语音为起点,现在大模型带来了语音技术发展的全新机会,基于大语言模型框架,结合讯飞多维度语音属性解耦表征预训练,今天还发布了讯飞星火语音大模型。
在多语种语音识别上,首批37个主流语种效果超过OpenAI Whisper V3;多语种语音合成上,首批40个语种平均MOS分绝对提升0.25;超拟人语音合成上,MOS达到4.5,拟人度达到83%以上。
现在搭载语音大模型的讯飞翻译机都将实现升级,翻译机将不仅实现35个语种的自动识别,还可以提供辅助交流的能力,当询问翻译机景点和美食时,会得到相关信息的回答。
同时此次还发布了星火开源大模型“星火开源-13B”,包括了基础模型、精调模型。星火开源大模型是根据去年5月的星火1.0版本(13B)改进而来,增加了数据、能力、针对应用场景的工具链,并且针对国产安全可控进行了更系统性的设计,目前“星火开源-13B”已在华为昇思开源社区首发上线。
大模型不仅要水平上的提升,更重要的是实现应用上的落地。刘庆峰最后也给出了讯飞星火的2024年展望:通用大模型持续对标、行业应用实现超越、自主可控生态繁荣。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。