“讯飞星火3.5达到了预期。”科大讯飞董事长刘庆峰说。
通用人工智能必将影响人类的生产和生活已经不言而喻,这一年百模大战下来,我们需要的是在场景中发现价值。
今天,讯飞星火V3.5的到来,相比10月24日发布的讯飞星火V3.0实现了七大能力全面提升,包括文本生成提升7.3%,语言理解提升7.6%,知识问答提升4.7%,逻辑推理提升9.5%,数学能力提升9.8%,代码能力提升8.0%,多模态能力提升6.6%。
在多项核心能力上,讯飞星火V3.5已经逼近GPT 4 Turbo,在语言理解、数学能力方面超过GPT-4 Turbo,代码方面达到GPT-4 Turbo的96%,多模态理解后面达到GPT-4V的91%
科大讯飞同时也在进行自主算力平台的建设,2023年10月24日,首个支撑万亿参数大模型训练的国产算力平台“飞星一号”正式启动,讯飞星火V3.5正是基于此进行训练。
科大讯飞希望大模型能解决真实世界刚需,所以伴随多项原子能力共同作用,讯飞星火V3.5全新赋能万物互联时代人机交互。
通过科大讯飞研究院院长刘聪与讯飞星火的对话,讯飞星火V3.5表现出共情感,这是得益于语义理解、指令跟随、多轮对话、情绪感知、拟人合成的配合。

讯飞星火V3.5全新赋能知识学习于内容创作,集合了要素抽取、概念理解、知识推理、问题生成、图文生成能力。
像使用讯飞智文生成PPT后,想要在页面中增加图片,可以让助手给出提示词生成图片,PPT文字也可以进一步通过助手优化,并支持虚拟人对PPT进行讲解。

讯飞星火V3.5全新提升数智化生产力,集合了逻辑推理、时空推理、数学能力、代码能力、多模态能力。

科大讯飞最早就是以语音为起点,现在大模型带来了语音技术发展的全新机会,基于大语言模型框架,结合讯飞多维度语音属性解耦表征预训练,今天还发布了讯飞星火语音大模型。

在多语种语音识别上,首批37个主流语种效果超过OpenAI Whisper V3;多语种语音合成上,首批40个语种平均MOS分绝对提升0.25;超拟人语音合成上,MOS达到4.5,拟人度达到83%以上。
现在搭载语音大模型的讯飞翻译机都将实现升级,翻译机将不仅实现35个语种的自动识别,还可以提供辅助交流的能力,当询问翻译机景点和美食时,会得到相关信息的回答。
同时此次还发布了星火开源大模型“星火开源-13B”,包括了基础模型、精调模型。星火开源大模型是根据去年5月的星火1.0版本(13B)改进而来,增加了数据、能力、针对应用场景的工具链,并且针对国产安全可控进行了更系统性的设计,目前“星火开源-13B”已在华为昇思开源社区首发上线。

大模型不仅要水平上的提升,更重要的是实现应用上的落地。刘庆峰最后也给出了讯飞星火的2024年展望:通用大模型持续对标、行业应用实现超越、自主可控生态繁荣。
好文章,需要你的鼓励
英特尔第三季度财报超华尔街预期,净收入达41亿美元。公司通过裁员等成本削减措施及软银、英伟达和美国政府的大额投资实现复苏。第三季度资产负债表增加200亿美元,营收增长至137亿美元。尽管财务表现强劲,但代工业务的未来发展策略仍不明朗,该业务一直表现不佳且面临政府投资条件限制。
美国认知科学研究院团队首次成功将进化策略扩展到数十亿参数的大语言模型微调,在多项测试中全面超越传统强化学习方法。该技术仅需20%的训练样本就能达到同等效果,且表现更稳定,为AI训练开辟了全新路径。
微软发布新版Copilot人工智能助手,支持最多32人同时参与聊天会话的Groups功能,并新增连接器可访问OneDrive、Outlook、Gmail等多项服务。助手记忆功能得到增强,可保存用户信息供未来使用。界面新增名为Mico的AI角色,并提供"真实对话"模式生成更机智回应。医疗研究功能也得到改进,可基于哈佛健康等可靠来源提供答案。同时推出内置于Edge浏览器的Copilot Actions功能,可自动执行退订邮件、预订餐厅等任务。
纽约大学等机构联合开发的ThermalGen系统能够将普通彩色照片智能转换为对应的热成像图片,解决了热成像数据稀缺昂贵的难题。该系统采用创新的流匹配生成模型和风格解耦机制,能适应从卫星到地面的多种拍摄场景,在各类测试中表现优异。研究团队还贡献了三个大规模新数据集,并计划开源全部技术资源,为搜救、建筑检测、自动驾驶等领域提供强有力的技术支撑。