“讯飞星火3.5达到了预期。”科大讯飞董事长刘庆峰说。
通用人工智能必将影响人类的生产和生活已经不言而喻,这一年百模大战下来,我们需要的是在场景中发现价值。
今天,讯飞星火V3.5的到来,相比10月24日发布的讯飞星火V3.0实现了七大能力全面提升,包括文本生成提升7.3%,语言理解提升7.6%,知识问答提升4.7%,逻辑推理提升9.5%,数学能力提升9.8%,代码能力提升8.0%,多模态能力提升6.6%。
在多项核心能力上,讯飞星火V3.5已经逼近GPT 4 Turbo,在语言理解、数学能力方面超过GPT-4 Turbo,代码方面达到GPT-4 Turbo的96%,多模态理解后面达到GPT-4V的91%
科大讯飞同时也在进行自主算力平台的建设,2023年10月24日,首个支撑万亿参数大模型训练的国产算力平台“飞星一号”正式启动,讯飞星火V3.5正是基于此进行训练。
科大讯飞希望大模型能解决真实世界刚需,所以伴随多项原子能力共同作用,讯飞星火V3.5全新赋能万物互联时代人机交互。
通过科大讯飞研究院院长刘聪与讯飞星火的对话,讯飞星火V3.5表现出共情感,这是得益于语义理解、指令跟随、多轮对话、情绪感知、拟人合成的配合。
讯飞星火V3.5全新赋能知识学习于内容创作,集合了要素抽取、概念理解、知识推理、问题生成、图文生成能力。
像使用讯飞智文生成PPT后,想要在页面中增加图片,可以让助手给出提示词生成图片,PPT文字也可以进一步通过助手优化,并支持虚拟人对PPT进行讲解。
讯飞星火V3.5全新提升数智化生产力,集合了逻辑推理、时空推理、数学能力、代码能力、多模态能力。
科大讯飞最早就是以语音为起点,现在大模型带来了语音技术发展的全新机会,基于大语言模型框架,结合讯飞多维度语音属性解耦表征预训练,今天还发布了讯飞星火语音大模型。
在多语种语音识别上,首批37个主流语种效果超过OpenAI Whisper V3;多语种语音合成上,首批40个语种平均MOS分绝对提升0.25;超拟人语音合成上,MOS达到4.5,拟人度达到83%以上。
现在搭载语音大模型的讯飞翻译机都将实现升级,翻译机将不仅实现35个语种的自动识别,还可以提供辅助交流的能力,当询问翻译机景点和美食时,会得到相关信息的回答。
同时此次还发布了星火开源大模型“星火开源-13B”,包括了基础模型、精调模型。星火开源大模型是根据去年5月的星火1.0版本(13B)改进而来,增加了数据、能力、针对应用场景的工具链,并且针对国产安全可控进行了更系统性的设计,目前“星火开源-13B”已在华为昇思开源社区首发上线。
大模型不仅要水平上的提升,更重要的是实现应用上的落地。刘庆峰最后也给出了讯飞星火的2024年展望:通用大模型持续对标、行业应用实现超越、自主可控生态繁荣。
好文章,需要你的鼓励
Atlassian、Intuit和AWS三大企业巨头正在为智能代理时代做准备,重新思考软件构建方式。当前企业API为人类使用而设计,未来API将成为多模型原生接口。Intuit在QuickBooks中应用自动发票生成,使企业平均提前5天收款;AWS通过AI辅助迁移服务显著提升效率;Atlassian推出内部员工入职代理和客户代理,节省大量时间成本。专家强调需要建立强大的数据架构和信任机制。
这项研究首次系统评估了AI代码智能体在科学研究扩展方面的能力。研究团队设计了包含12个真实研究任务的REXBENCH基准,测试了九个先进AI智能体的表现。结果显示,即使最优秀的智能体成功率也仅为25%,远低于实用化要求,揭示了当前AI在处理复杂科学推理任务时的显著局限性。
MIT研究发现,使用生成式AI完成任务时,大脑运作方式与单纯依靠自身思考存在显著差异。研究显示,使用ChatGPT等工具的用户记忆力更差,神经连接活动减少,对所写内容的回忆能力明显下降。虽然AI工具能提高效率,但可能导致用户缺乏对知识的深度理解和掌控感。研究强调需要更多科学数据来了解AI使用对人类认知的长期影响。
俄罗斯莫斯科国立大学研究团队开发出MEMFOF光流估计新方法,在保持顶尖精度的同时将1080p视频分析的GPU内存消耗从8GB降至2GB,实现约4倍内存节省。该方法通过三帧策略、相关性体积优化和高分辨率训练在多个国际基准测试中取得第一名成绩,为高清视频分析技术的普及奠定基础。