人工智能 关键字列表
让大语言模型变身"省钱高手":格罗宁根大学突破性EAGER技术让AI推理省钱又聪明

让大语言模型变身"省钱高手":格罗宁根大学突破性EAGER技术让AI推理省钱又聪明

荷兰格罗宁根大学等机构联合发布的EAGER技术,通过监测AI推理过程中的不确定性来动态分配计算资源,实现了在减少65%计算成本的同时提升37%准确率的突破。该技术可直接应用于现有模型,在数学、科学、编程等多领域测试中均表现优异,为AI推理优化开辟了全新方向。

西湖大学联合团队首创3D空间推理新框架:让AI像人类一样"看懂"立体世界

西湖大学联合团队首创3D空间推理新框架:让AI像人类一样"看懂"立体世界

西湖大学联合团队开发出首个端到端3D空间推理系统GS-Reasoner,解决了AI难以同时处理物体识别和空间推理的技术难题。该系统通过创新的双路径融合技术和接地思维链训练方法,实现了无需外部工具的自主物体定位和复杂空间推理能力,在多项权威测试中达到最优性能,为自动驾驶、机器人导航等应用开辟新路径。

上海交通大学与阿里巴巴揭秘AI推理新奥秘:注意力机制竟能暴露大模型思考节奏

上海交通大学与阿里巴巴揭秘AI推理新奥秘:注意力机制竟能暴露大模型思考节奏

上海交通大学与阿里巴巴合作研究发现,大型语言模型在推理时展现出"预设与锚定"的思考节奏。通过分析注意力机制,研究团队首次揭示了AI内部的推理逻辑,并基于此开发了三种新的强化学习训练策略,在多个数学推理任务上获得显著性能提升,为AI系统的可解释性和训练效率提供了突破性进展。

语音时代的全能助手来了!看SenseTime如何让AI同时听懂、看懂、说话还能记住所有对话

语音时代的全能助手来了!看SenseTime如何让AI同时听懂、看懂、说话还能记住所有对话

商汤科技研究团队开发的InteractiveOmni是一个突破性的全模态AI助手,能够同时处理图像、视频、音频和文字,并具备强大的多轮对话记忆能力。该模型采用端到端架构,实现了从多模态输入到语音输出的统一处理,在多项基准测试中表现优异。特别值得关注的是,4B参数版本就能达到接近7B模型的性能,且已开源供研究使用。

斯坦福大学新发现:AI并行生成的"快与好"难题——为什么AI写作速度快了质量却下降了?

斯坦福大学新发现:AI并行生成的"快与好"难题——为什么AI写作速度快了质量却下降了?

这项由斯坦福大学等多所顶尖院校完成的研究发现,虽然扩散语言模型承诺通过并行处理大幅提升AI文本生成速度,但实际上存在严重的质量问题。研究团队开发了专门的测试平台ParallelBench,发现AI在处理需要协调的任务时表现糟糕,揭示了AI发展中速度与质量的根本性权衡问题,为未来AI技术发展指明了新方向。

哈尔滨工业大学突破:让AI像人一样同时掌握语言和音乐的双重艺术

哈尔滨工业大学突破:让AI像人一样同时掌握语言和音乐的双重艺术

哈尔滨工业大学研究团队开发出UniMoE-Audio系统,首次实现AI同时掌握语音合成和音乐创作。该系统采用动态容量专家混合架构和三阶段训练策略,解决了传统方法中的任务冲突和数据不平衡问题。实验显示,系统在语音质量和音乐美学评分上均达到业界领先水平,为多模态AI发展开辟新路径,应用前景覆盖教育、娱乐、内容创作等多个领域。

震惊!机器人看到你挥手却不知道你在干什么——复旦大学团队揭露AI机器人的"表面功夫"真相

震惊!机器人看到你挥手却不知道你在干什么——复旦大学团队揭露AI机器人的"表面功夫"真相

复旦大学研究团队通过LIBERO-Plus测试平台对当前主流AI机器人进行了全面"体检",发现这些在标准测试中表现优异的系统实际上极其脆弱:轻微的环境变化就会导致性能从95%暴跌至30%以下,且大多数机器人实际上忽略语言指令,主要依赖固定的视觉模式匹配。研究揭示了AI机器人类似"应试教育"的局限性,为行业发展提供了重要反思。

AI工作负载两年内将主导数据中心建设

AI工作负载两年内将主导数据中心建设

Turner & Townsend发布的2025年数据中心建设成本指数报告显示,AI工作负载激增正推动高密度液冷数据中心需求。四分之三的受访者已在从事AI数据中心项目,47%预计AI数据中心将在两年内占据一半以上工作负载。预计到2027年,AI优化设施可能占全球数据中心市场28%。53%受访者认为液冷技术将主导未来高密度项目。电力可用性成为开发商面临的首要约束,48%的受访者认为电网连接延迟是主要障碍。

AWS投资500亿美元为美国政府建设AI基础设施

AWS投资500亿美元为美国政府建设AI基础设施

亚马逊云服务宣布投资500亿美元,专门为美国政府构建AI高性能计算基础设施。该项目将新增1.3千兆瓦算力,扩大政府机构对AWS AI服务的访问,包括Amazon SageMaker、Amazon Bedrock和Claude聊天机器人等。预计2026年开工建设。AWS CEO表示此举将彻底改变联邦机构利用超级计算的方式,消除技术障碍,助力美国在AI时代保持领先地位。

微软发布Fara-7B智能体模型,可在PC端本地运行控制计算机

微软发布Fara-7B智能体模型,可在PC端本地运行控制计算机

微软推出首个智能体小语言模型Fara-7B,专为"计算机使用"任务设计,能够控制鼠标和键盘完成各种操作。该模型仅有70亿参数,可在个人电脑上本地运行,无需联网或向云端传输数据,有效提升隐私保护和响应速度。Fara-7B能够通过视觉感知网站内容,执行在线购物、信息搜索和地图测距等任务,性能可媲美更大规模的模型系统。

Monday.com:AI技术助力解决现代工作效率危机

Monday.com:AI技术助力解决现代工作效率危机

Monday.com在悉尼会议上表示,现代工作模式存在问题,AI技术是扭转生产力下降的关键。该公司指出61%的澳洲员工面临职业倦怠,劳动生产率自2022年来下降1.2%。公司推出Agent Factory功能,让用户构建AI语音代理。销售团队采用AI后胜率提升30%。三家本地客户分享应用案例:澳网通过平台管理复杂赛事运营,Ray White整合设计平台实现营销自动化,Freedom家具零售商获得26倍投资回报率。

Google联手Accel寻找印度下一代AI突破企业

Google联手Accel寻找印度下一代AI突破企业

谷歌与Accel合作推出针对印度早期AI初创企业的投资计划,通过Accel的Atoms项目为每家初创企业提供最高200万美元投资。该计划专注于支持印度及印度裔创始人从零开始构建AI产品,旨在为数十亿印度用户打造AI产品,同时支持印度开发的AI产品走向全球市场。创始人将获得资金、计算资源、技术支持和导师指导等全方位帮助。

Anthropic发布Opus 4.5版本,集成Chrome和Excel新功能

Anthropic发布Opus 4.5版本,集成Chrome和Excel新功能

Anthropic周一发布了旗舰模型Opus 4.5,这是4.5系列的最后一个模型。新版本在编程、工具使用和问题解决等基准测试中表现出色,是首个在SWE-Bench验证测试中得分超过80%的模型。同时推出Claude for Chrome和Claude for Excel产品,分别面向不同用户群体。Opus 4.5还改进了长文本处理的内存管理,支持付费用户的"无限聊天"功能,并针对智能体应用场景进行了优化,将与OpenAI的GPT 5.1和谷歌的Gemini 3展开竞争。

Kneron发布新一代AI芯片,让大语言模型脱离云端运行于本地设备

Kneron发布新一代AI芯片,让大语言模型脱离云端运行于本地设备

总部位于圣地亚哥的AI公司耐能发布新一代KL1140芯片,这是首款能在边缘端运行完整变换器网络的神经处理单元。该芯片可将大语言模型从云数据中心转移到便携式本地设备中,四颗芯片组合可实现类似GPU的性能,支持1200亿参数模型运行,功耗降低三分之一至一半,硬件成本减少十倍。

云端与边缘:AI驱动工程师重新考虑延迟问题

云端与边缘:AI驱动工程师重新考虑延迟问题

随着AI技术快速发展,企业正将工作负载从云端拉回本地。工程师再次专注于速度问题,通过边缘计算减少延迟。边缘计算将数据处理靠近数据源,显著降低延迟。混合云成为新趋势,不再是云端与边缘的优劣之争,而是针对特定工作负载选择合适方案。在国防等关键任务领域,边缘AI尤为重要,能够在网络中断时保持系统正常运行。

英国政府投资1.3亿美元推动AI芯片产业发展

英国政府投资1.3亿美元推动AI芯片产业发展

英国政府承诺投资1亿英镑购买英国公司的新兴芯片技术,以支持人工智能产业发展。科学大臣肯德尔表示,政府将向生产AI硬件的英国初创企业提供保证付款,帮助生命科学和金融服务等行业。该计划采用"首位客户"模式,政府将提前承诺购买符合性能标准的AI推理芯片。尽管投资规模相比美中两国较小,但英国希望在其优势领域实现世界领先地位。

Wasabi推出Fire高性能存储服务挑战云巨头

Wasabi推出Fire高性能存储服务挑战云巨头

Wasabi公司推出Fire高性能存储服务,专门针对AI工作负载设计。该服务采用NVMe SSD技术,提供个位数毫秒响应时间,比常规S3存储快5倍。定价为每TB每月19.99美元,无出口费用,成本仅为AWS S3 Express的六分之一。Fire服务支持AI训练、实时推理和高频数据记录等计算密集型应用,并在硅谷新开设存储区域为AI初创企业提供服务。

Momentic获得1500万美元融资,成为AI时代软件质量"真相之源"

Momentic获得1500万美元融资,成为AI时代软件质量"真相之源"

AI驱动的软件测试平台Momentic宣布完成1500万美元A轮融资,Standard Capital领投。该平台通过自然语言描述生成自动化测试用例,解决传统QA流程耗时费力的问题。平台能自动修复因UI结构变化导致的测试失效,已获得Notion、Quora等知名企业信任。上月执行超2亿次测试步骤,阻止39万个漏洞进入生产环境。

360 AI Research团队重磅发布:让机器真正"看懂"中英文图片的FG-CLIP 2模型

360 AI Research团队重磅发布:让机器真正"看懂"中英文图片的FG-CLIP 2模型

360 AI Research团队发布的FG-CLIP 2是一个突破性的双语精细视觉语言对齐模型,能够同时处理中英文并进行精细的图像理解。该模型通过两阶段训练策略和多目标联合优化,在29个数据集的8类任务中均达到最先进性能,特别创新了文本内模态对比损失机制。团队还构建了首个中文多模态评测基准,填补了该领域空白,为智能商务、安防监控、医疗影像等应用开辟新可能。

香港大学研究团队发现:两个AI模型的简单融合,竟能创造出比复杂方法更强的推理能力

香港大学研究团队发现:两个AI模型的简单融合,竟能创造出比复杂方法更强的推理能力

香港大学和清华大学研究团队发现,通过最简单的模型插值方法融合"深思型"和"快答型"AI模型,能够创造出比复杂融合算法更优秀的推理系统。研究揭示了融合过程遵循三阶段进化规律,通过精确调节混合比例可以实现推理深度和效率的完美平衡。实验显示这种方法在数学推理、指令跟随等任务上显著超越传统方法,为AI技术的民主化和普及提供了实用方案。