在千亿模型满天飞,MOE架构正流行的当下,一个在AI领域名不见经传的企业,贝壳找房,发布了一款32B的稠密模型,AM-Thinking- V1。在包括AIME在内的多项AI基准测试中,这款中等参数模型碾压了满血版671B DeepSeek-R1,性能与阿里刚刚发布的Qwen3-235B-A22B持平。
北京时间5月21日,百度发布2025年第一季度财报,这场会议不仅仅是一次常规的财务数据披露,更像是百度在AI时代战略布局的全景展示,李彦宏在开场发言中,将2025年第一季度形容为一个“稳健的开局”。
微软研究院前不久发布了一篇论文,揭示了一个反常识的现象:当我们和AI进行长时间多轮对话时,它们会变得越来越"糊涂",给出的答案质量也会明显下降。微软研究院的这项研究,用严谨的科学方法证实了这个现象的存在,这不是个别模型的问题,而是几乎所有大模型的通病。研究团队测试了包括GPT-4、Claude、Gemini在内的15个主流AI模型,发现它们在多轮对话中的表现平均下降了39%。
魔法原子举办2025场景战略发布会 总裁吴长征:5年之后人形机器人将进入普通人的家庭。
首批上线超3万条高质量真机训练数据,包含多种自由度灵巧手的训练数据及专门针对手部任务的模仿学习数据,面向全球开发者及科研机构开源共享,提供从数据采集、训练、部署的一站式解决方案。
早在多年前,用友就已在思考未来软件架构的演进方向。那时强调的是从单体架构向微服务转型,也就是云原生的发展路径。然而,随着大模型的崛起,下一代软件架构正逐步迈向AI原生,软件与云的交互数据流将以大模型为中枢。
今天,软件国产化替代不再是单纯的“平替”,而是实现价值化和差异化的跃升。借助智能高效的软件,国央企将打破发展瓶颈、提升运营效率,标志着中国企业的数智化进程进入了一个全新的阶段。
本文将在DeepSeek-R1- Distill-Qwen-32B推理场景下,以面向企业级应用且成本最低可控制在5-6万元人民币的4路英特尔锐炫(TM)A770显卡 + 至强(R)W处理器的解决方案为例,详细阐述搭建硬件环境、配置驱动与软件、优化参数设置等步骤,手把手教大家部署和配置这一方案。