“讯飞星火3.5达到了预期。”科大讯飞董事长刘庆峰说。
通用人工智能必将影响人类的生产和生活已经不言而喻,这一年百模大战下来,我们需要的是在场景中发现价值。
今天,讯飞星火V3.5的到来,相比10月24日发布的讯飞星火V3.0实现了七大能力全面提升,包括文本生成提升7.3%,语言理解提升7.6%,知识问答提升4.7%,逻辑推理提升9.5%,数学能力提升9.8%,代码能力提升8.0%,多模态能力提升6.6%。
在多项核心能力上,讯飞星火V3.5已经逼近GPT 4 Turbo,在语言理解、数学能力方面超过GPT-4 Turbo,代码方面达到GPT-4 Turbo的96%,多模态理解后面达到GPT-4V的91%
科大讯飞同时也在进行自主算力平台的建设,2023年10月24日,首个支撑万亿参数大模型训练的国产算力平台“飞星一号”正式启动,讯飞星火V3.5正是基于此进行训练。
科大讯飞希望大模型能解决真实世界刚需,所以伴随多项原子能力共同作用,讯飞星火V3.5全新赋能万物互联时代人机交互。
通过科大讯飞研究院院长刘聪与讯飞星火的对话,讯飞星火V3.5表现出共情感,这是得益于语义理解、指令跟随、多轮对话、情绪感知、拟人合成的配合。

讯飞星火V3.5全新赋能知识学习于内容创作,集合了要素抽取、概念理解、知识推理、问题生成、图文生成能力。
像使用讯飞智文生成PPT后,想要在页面中增加图片,可以让助手给出提示词生成图片,PPT文字也可以进一步通过助手优化,并支持虚拟人对PPT进行讲解。

讯飞星火V3.5全新提升数智化生产力,集合了逻辑推理、时空推理、数学能力、代码能力、多模态能力。

科大讯飞最早就是以语音为起点,现在大模型带来了语音技术发展的全新机会,基于大语言模型框架,结合讯飞多维度语音属性解耦表征预训练,今天还发布了讯飞星火语音大模型。

在多语种语音识别上,首批37个主流语种效果超过OpenAI Whisper V3;多语种语音合成上,首批40个语种平均MOS分绝对提升0.25;超拟人语音合成上,MOS达到4.5,拟人度达到83%以上。
现在搭载语音大模型的讯飞翻译机都将实现升级,翻译机将不仅实现35个语种的自动识别,还可以提供辅助交流的能力,当询问翻译机景点和美食时,会得到相关信息的回答。
同时此次还发布了星火开源大模型“星火开源-13B”,包括了基础模型、精调模型。星火开源大模型是根据去年5月的星火1.0版本(13B)改进而来,增加了数据、能力、针对应用场景的工具链,并且针对国产安全可控进行了更系统性的设计,目前“星火开源-13B”已在华为昇思开源社区首发上线。

大模型不仅要水平上的提升,更重要的是实现应用上的落地。刘庆峰最后也给出了讯飞星火的2024年展望:通用大模型持续对标、行业应用实现超越、自主可控生态繁荣。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。