人工智能文章列表第11页-至顶网频道

2025-11-25

语音时代的全能助手来了！看SenseTime如何让AI同时听懂、看懂、说话还能记住所有对话

商汤科技研究团队开发的InteractiveOmni是一个突破性的全模态AI助手，能够同时处理图像、视频、音频和文字，并具备强大的多轮对话记忆能力。该模型采用端到端架构，实现了从多模态输入到语音输出的统一处理，在多项基准测试中表现优异。特别值得关注的是，4B参数版本就能达到接近7B模型的性能，且已开源供研究使用。

斯坦福大学新发现：AI并行生成的"快与好"难题——为什么AI写作速度快了质量却下降了？

这项由斯坦福大学等多所顶尖院校完成的研究发现，虽然扩散语言模型承诺通过并行处理大幅提升AI文本生成速度，但实际上存在严重的质量问题。研究团队开发了专门的测试平台ParallelBench，发现AI在处理需要协调的任务时表现糟糕，揭示了AI发展中速度与质量的根本性权衡问题，为未来AI技术发展指明了新方向。

哈尔滨工业大学突破：让AI像人一样同时掌握语言和音乐的双重艺术

哈尔滨工业大学研究团队开发出UniMoE-Audio系统，首次实现AI同时掌握语音合成和音乐创作。该系统采用动态容量专家混合架构和三阶段训练策略，解决了传统方法中的任务冲突和数据不平衡问题。实验显示，系统在语音质量和音乐美学评分上均达到业界领先水平，为多模态AI发展开辟新路径，应用前景覆盖教育、娱乐、内容创作等多个领域。

震惊！机器人看到你挥手却不知道你在干什么——复旦大学团队揭露AI机器人的"表面功夫"真相

复旦大学研究团队通过LIBERO-Plus测试平台对当前主流AI机器人进行了全面"体检"，发现这些在标准测试中表现优异的系统实际上极其脆弱：轻微的环境变化就会导致性能从95%暴跌至30%以下，且大多数机器人实际上忽略语言指令，主要依赖固定的视觉模式匹配。研究揭示了AI机器人类似"应试教育"的局限性，为行业发展提供了重要反思。

Turner & Townsend发布的2025年数据中心建设成本指数报告显示，AI工作负载激增正推动高密度液冷数据中心需求。四分之三的受访者已在从事AI数据中心项目，47%预计AI数据中心将在两年内占据一半以上工作负载。预计到2027年，AI优化设施可能占全球数据中心市场28%。53%受访者认为液冷技术将主导未来高密度项目。电力可用性成为开发商面临的首要约束，48%的受访者认为电网连接延迟是主要障碍。

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: