人工智能 关键字列表
语音时代的全能助手来了!看SenseTime如何让AI同时听懂、看懂、说话还能记住所有对话

语音时代的全能助手来了!看SenseTime如何让AI同时听懂、看懂、说话还能记住所有对话

商汤科技研究团队开发的InteractiveOmni是一个突破性的全模态AI助手,能够同时处理图像、视频、音频和文字,并具备强大的多轮对话记忆能力。该模型采用端到端架构,实现了从多模态输入到语音输出的统一处理,在多项基准测试中表现优异。特别值得关注的是,4B参数版本就能达到接近7B模型的性能,且已开源供研究使用。

斯坦福大学新发现:AI并行生成的"快与好"难题——为什么AI写作速度快了质量却下降了?

斯坦福大学新发现:AI并行生成的"快与好"难题——为什么AI写作速度快了质量却下降了?

这项由斯坦福大学等多所顶尖院校完成的研究发现,虽然扩散语言模型承诺通过并行处理大幅提升AI文本生成速度,但实际上存在严重的质量问题。研究团队开发了专门的测试平台ParallelBench,发现AI在处理需要协调的任务时表现糟糕,揭示了AI发展中速度与质量的根本性权衡问题,为未来AI技术发展指明了新方向。

哈尔滨工业大学突破:让AI像人一样同时掌握语言和音乐的双重艺术

哈尔滨工业大学突破:让AI像人一样同时掌握语言和音乐的双重艺术

哈尔滨工业大学研究团队开发出UniMoE-Audio系统,首次实现AI同时掌握语音合成和音乐创作。该系统采用动态容量专家混合架构和三阶段训练策略,解决了传统方法中的任务冲突和数据不平衡问题。实验显示,系统在语音质量和音乐美学评分上均达到业界领先水平,为多模态AI发展开辟新路径,应用前景覆盖教育、娱乐、内容创作等多个领域。

震惊!机器人看到你挥手却不知道你在干什么——复旦大学团队揭露AI机器人的"表面功夫"真相

震惊!机器人看到你挥手却不知道你在干什么——复旦大学团队揭露AI机器人的"表面功夫"真相

复旦大学研究团队通过LIBERO-Plus测试平台对当前主流AI机器人进行了全面"体检",发现这些在标准测试中表现优异的系统实际上极其脆弱:轻微的环境变化就会导致性能从95%暴跌至30%以下,且大多数机器人实际上忽略语言指令,主要依赖固定的视觉模式匹配。研究揭示了AI机器人类似"应试教育"的局限性,为行业发展提供了重要反思。

AI工作负载两年内将主导数据中心建设

AI工作负载两年内将主导数据中心建设

Turner & Townsend发布的2025年数据中心建设成本指数报告显示,AI工作负载激增正推动高密度液冷数据中心需求。四分之三的受访者已在从事AI数据中心项目,47%预计AI数据中心将在两年内占据一半以上工作负载。预计到2027年,AI优化设施可能占全球数据中心市场28%。53%受访者认为液冷技术将主导未来高密度项目。电力可用性成为开发商面临的首要约束,48%的受访者认为电网连接延迟是主要障碍。

AWS投资500亿美元为美国政府建设AI基础设施

AWS投资500亿美元为美国政府建设AI基础设施

亚马逊云服务宣布投资500亿美元,专门为美国政府构建AI高性能计算基础设施。该项目将新增1.3千兆瓦算力,扩大政府机构对AWS AI服务的访问,包括Amazon SageMaker、Amazon Bedrock和Claude聊天机器人等。预计2026年开工建设。AWS CEO表示此举将彻底改变联邦机构利用超级计算的方式,消除技术障碍,助力美国在AI时代保持领先地位。

微软发布Fara-7B智能体模型,可在PC端本地运行控制计算机

微软发布Fara-7B智能体模型,可在PC端本地运行控制计算机

微软推出首个智能体小语言模型Fara-7B,专为"计算机使用"任务设计,能够控制鼠标和键盘完成各种操作。该模型仅有70亿参数,可在个人电脑上本地运行,无需联网或向云端传输数据,有效提升隐私保护和响应速度。Fara-7B能够通过视觉感知网站内容,执行在线购物、信息搜索和地图测距等任务,性能可媲美更大规模的模型系统。

Monday.com:AI技术助力解决现代工作效率危机

Monday.com:AI技术助力解决现代工作效率危机

Monday.com在悉尼会议上表示,现代工作模式存在问题,AI技术是扭转生产力下降的关键。该公司指出61%的澳洲员工面临职业倦怠,劳动生产率自2022年来下降1.2%。公司推出Agent Factory功能,让用户构建AI语音代理。销售团队采用AI后胜率提升30%。三家本地客户分享应用案例:澳网通过平台管理复杂赛事运营,Ray White整合设计平台实现营销自动化,Freedom家具零售商获得26倍投资回报率。

Google联手Accel寻找印度下一代AI突破企业

Google联手Accel寻找印度下一代AI突破企业

谷歌与Accel合作推出针对印度早期AI初创企业的投资计划,通过Accel的Atoms项目为每家初创企业提供最高200万美元投资。该计划专注于支持印度及印度裔创始人从零开始构建AI产品,旨在为数十亿印度用户打造AI产品,同时支持印度开发的AI产品走向全球市场。创始人将获得资金、计算资源、技术支持和导师指导等全方位帮助。

Anthropic发布Opus 4.5版本,集成Chrome和Excel新功能

Anthropic发布Opus 4.5版本,集成Chrome和Excel新功能

Anthropic周一发布了旗舰模型Opus 4.5,这是4.5系列的最后一个模型。新版本在编程、工具使用和问题解决等基准测试中表现出色,是首个在SWE-Bench验证测试中得分超过80%的模型。同时推出Claude for Chrome和Claude for Excel产品,分别面向不同用户群体。Opus 4.5还改进了长文本处理的内存管理,支持付费用户的"无限聊天"功能,并针对智能体应用场景进行了优化,将与OpenAI的GPT 5.1和谷歌的Gemini 3展开竞争。

Kneron发布新一代AI芯片,让大语言模型脱离云端运行于本地设备

Kneron发布新一代AI芯片,让大语言模型脱离云端运行于本地设备

总部位于圣地亚哥的AI公司耐能发布新一代KL1140芯片,这是首款能在边缘端运行完整变换器网络的神经处理单元。该芯片可将大语言模型从云数据中心转移到便携式本地设备中,四颗芯片组合可实现类似GPU的性能,支持1200亿参数模型运行,功耗降低三分之一至一半,硬件成本减少十倍。

云端与边缘:AI驱动工程师重新考虑延迟问题

云端与边缘:AI驱动工程师重新考虑延迟问题

随着AI技术快速发展,企业正将工作负载从云端拉回本地。工程师再次专注于速度问题,通过边缘计算减少延迟。边缘计算将数据处理靠近数据源,显著降低延迟。混合云成为新趋势,不再是云端与边缘的优劣之争,而是针对特定工作负载选择合适方案。在国防等关键任务领域,边缘AI尤为重要,能够在网络中断时保持系统正常运行。

英国政府投资1.3亿美元推动AI芯片产业发展

英国政府投资1.3亿美元推动AI芯片产业发展

英国政府承诺投资1亿英镑购买英国公司的新兴芯片技术,以支持人工智能产业发展。科学大臣肯德尔表示,政府将向生产AI硬件的英国初创企业提供保证付款,帮助生命科学和金融服务等行业。该计划采用"首位客户"模式,政府将提前承诺购买符合性能标准的AI推理芯片。尽管投资规模相比美中两国较小,但英国希望在其优势领域实现世界领先地位。

Wasabi推出Fire高性能存储服务挑战云巨头

Wasabi推出Fire高性能存储服务挑战云巨头

Wasabi公司推出Fire高性能存储服务,专门针对AI工作负载设计。该服务采用NVMe SSD技术,提供个位数毫秒响应时间,比常规S3存储快5倍。定价为每TB每月19.99美元,无出口费用,成本仅为AWS S3 Express的六分之一。Fire服务支持AI训练、实时推理和高频数据记录等计算密集型应用,并在硅谷新开设存储区域为AI初创企业提供服务。

Momentic获得1500万美元融资,成为AI时代软件质量"真相之源"

Momentic获得1500万美元融资,成为AI时代软件质量"真相之源"

AI驱动的软件测试平台Momentic宣布完成1500万美元A轮融资,Standard Capital领投。该平台通过自然语言描述生成自动化测试用例,解决传统QA流程耗时费力的问题。平台能自动修复因UI结构变化导致的测试失效,已获得Notion、Quora等知名企业信任。上月执行超2亿次测试步骤,阻止39万个漏洞进入生产环境。

360 AI Research团队重磅发布:让机器真正"看懂"中英文图片的FG-CLIP 2模型

360 AI Research团队重磅发布:让机器真正"看懂"中英文图片的FG-CLIP 2模型

360 AI Research团队发布的FG-CLIP 2是一个突破性的双语精细视觉语言对齐模型,能够同时处理中英文并进行精细的图像理解。该模型通过两阶段训练策略和多目标联合优化,在29个数据集的8类任务中均达到最先进性能,特别创新了文本内模态对比损失机制。团队还构建了首个中文多模态评测基准,填补了该领域空白,为智能商务、安防监控、医疗影像等应用开辟新可能。

香港大学研究团队发现:两个AI模型的简单融合,竟能创造出比复杂方法更强的推理能力

香港大学研究团队发现:两个AI模型的简单融合,竟能创造出比复杂方法更强的推理能力

香港大学和清华大学研究团队发现,通过最简单的模型插值方法融合"深思型"和"快答型"AI模型,能够创造出比复杂融合算法更优秀的推理系统。研究揭示了融合过程遵循三阶段进化规律,通过精确调节混合比例可以实现推理深度和效率的完美平衡。实验显示这种方法在数学推理、指令跟随等任务上显著超越传统方法,为AI技术的民主化和普及提供了实用方案。

大语言模型秒变预言家:UC圣塔芭芭拉分校让AI一次预测多个词汇的突破性研究

大语言模型秒变预言家:UC圣塔芭芭拉分校让AI一次预测多个词汇的突破性研究

UC圣塔芭芭拉分校研究团队开发出直接多词解码技术(DMTD),通过重用大语言模型的后期层实现一次性生成多个词汇。该技术无需添加额外参数,仅通过重新组织内部处理流程就实现了2倍速度提升,同时保持96%以上的准确性。实验证明技术在大型模型上效果更佳,为AI交互效率提升开辟了新路径。

巧妙的对话助手:当AI学会"察言观色"记忆过往的Text-to-SQL突破(亚马逊、圣母大学联合研究)

巧妙的对话助手:当AI学会"察言观色"记忆过往的Text-to-SQL突破(亚马逊、圣母大学联合研究)

亚马逊与圣母大学联合研究团队开发出MTSQL-R1系统,解决了AI在多轮对话中处理数据库查询时的"健忘症"问题。该系统首次让AI具备对话记忆和自我验证能力,能够理解上下文并主动纠错。通过"提议-执行-验证-修正"循环和渐进式训练,在权威测试中超越现有方法,为智能数据分析助手奠定重要基础。

华为大学团队重新发明多智能体协作:用"超级图形"让AI团队沟通更聪明

华为大学团队重新发明多智能体协作:用"超级图形"让AI团队沟通更聪明

华南师范大学联合多所知名院校研究团队提出HyperAgent框架,通过"超图"结构革新多智能体协作方式。该方法让AI团队能够进行真正的群体沟通而非传统的点对点传话,在保持高准确率的同时大幅降低沟通成本,为复杂任务的AI协作提供了更自然高效的解决方案。