“讯飞星火3.5达到了预期。”科大讯飞董事长刘庆峰说。
通用人工智能必将影响人类的生产和生活已经不言而喻,这一年百模大战下来,我们需要的是在场景中发现价值。
今天,讯飞星火V3.5的到来,相比10月24日发布的讯飞星火V3.0实现了七大能力全面提升,包括文本生成提升7.3%,语言理解提升7.6%,知识问答提升4.7%,逻辑推理提升9.5%,数学能力提升9.8%,代码能力提升8.0%,多模态能力提升6.6%。
在多项核心能力上,讯飞星火V3.5已经逼近GPT 4 Turbo,在语言理解、数学能力方面超过GPT-4 Turbo,代码方面达到GPT-4 Turbo的96%,多模态理解后面达到GPT-4V的91%
科大讯飞同时也在进行自主算力平台的建设,2023年10月24日,首个支撑万亿参数大模型训练的国产算力平台“飞星一号”正式启动,讯飞星火V3.5正是基于此进行训练。
科大讯飞希望大模型能解决真实世界刚需,所以伴随多项原子能力共同作用,讯飞星火V3.5全新赋能万物互联时代人机交互。
通过科大讯飞研究院院长刘聪与讯飞星火的对话,讯飞星火V3.5表现出共情感,这是得益于语义理解、指令跟随、多轮对话、情绪感知、拟人合成的配合。
讯飞星火V3.5全新赋能知识学习于内容创作,集合了要素抽取、概念理解、知识推理、问题生成、图文生成能力。
像使用讯飞智文生成PPT后,想要在页面中增加图片,可以让助手给出提示词生成图片,PPT文字也可以进一步通过助手优化,并支持虚拟人对PPT进行讲解。
讯飞星火V3.5全新提升数智化生产力,集合了逻辑推理、时空推理、数学能力、代码能力、多模态能力。
科大讯飞最早就是以语音为起点,现在大模型带来了语音技术发展的全新机会,基于大语言模型框架,结合讯飞多维度语音属性解耦表征预训练,今天还发布了讯飞星火语音大模型。
在多语种语音识别上,首批37个主流语种效果超过OpenAI Whisper V3;多语种语音合成上,首批40个语种平均MOS分绝对提升0.25;超拟人语音合成上,MOS达到4.5,拟人度达到83%以上。
现在搭载语音大模型的讯飞翻译机都将实现升级,翻译机将不仅实现35个语种的自动识别,还可以提供辅助交流的能力,当询问翻译机景点和美食时,会得到相关信息的回答。
同时此次还发布了星火开源大模型“星火开源-13B”,包括了基础模型、精调模型。星火开源大模型是根据去年5月的星火1.0版本(13B)改进而来,增加了数据、能力、针对应用场景的工具链,并且针对国产安全可控进行了更系统性的设计,目前“星火开源-13B”已在华为昇思开源社区首发上线。
大模型不仅要水平上的提升,更重要的是实现应用上的落地。刘庆峰最后也给出了讯飞星火的2024年展望:通用大模型持续对标、行业应用实现超越、自主可控生态繁荣。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。