人工智能 关键字列表
圣母大学团队发明AI科学助手:让计算机也能像科学家一样搞发明创造

圣母大学团队发明AI科学助手:让计算机也能像科学家一样搞发明创造

这项由圣母大学和IBM研究院联合开展的研究,开发出了名为DeepEvolve的AI科学助手系统,能够像人类科学家一样进行深度文献研究并将创新想法转化为可执行的算法程序。该系统突破了传统AI要么只能改进算法但缺乏创新、要么只能提出想法但无法实现的局限,在化学、生物学、数学等九个科学领域的测试中都实现了显著的算法性能提升,为AI辅助科学发现开辟了新的道路。

卡内基梅隆大学重大发现:代码到底为什么能让AI变聪明?

卡内基梅隆大学重大发现:代码到底为什么能让AI变聪明?

卡内基梅隆大学研究团队通过3331次大规模实验,系统揭示了代码训练如何提升AI推理能力。研究发现,代码的结构特性比语义内容更重要,适当的抽象形式(如伪代码)可以达到与原始代码相同的效果。不同编程语言产生差异化影响:低抽象语言有利于数学推理,Python更适合自然语言任务。这些发现为AI训练数据的科学化设计提供了重要指导。

三星AI实验室7M参数小模型击败千亿LLM:递归推理的"小而美"革命

三星AI实验室7M参数小模型击败千亿LLM:递归推理的"小而美"革命

三星AI实验室提出的小型递归模型(TRM)仅用700万参数就在数独、迷宫和ARC-AGI等复杂推理任务上超越了千亿参数的大型语言模型。TRM通过递归改进答案的简洁机制,避免了复杂数学理论的依赖,用单一的2层网络替代了多网络架构。这项研究证明了在某些任务上,精巧的算法设计比参数堆叠更有效,为AI技术的民主化和普及提供了新思路。

格拉斯哥大学新技术解决AI医生"看图说话"的致命缺陷:让机器医生不再胡说八道

格拉斯哥大学新技术解决AI医生"看图说话"的致命缺陷:让机器医生不再胡说八道

格拉斯哥大学研究团队开发出"临床对比解码"技术,有效解决AI医疗系统的"幻觉"问题。该技术无需重新训练模型,通过双阶段实时校正机制,在MIMIC-CXR数据集上将AI诊断准确性提升17%。技术采用专家AI指导的方式,既防止漏诊又避免误诊,为AI医疗应用提供了实用的质量保障方案。

Meta首次突破:AI同时生成文字和图像,告别逐字逐图的传统模式

Meta首次突破:AI同时生成文字和图像,告别逐字逐图的传统模式

Meta公司FAIR实验室开发的OneFlow模型实现了AI领域的重大突破,首次让人工智能能够同时生成文字和图像,打破了传统"先文字后图像"的限制。该技术结合Edit Flow和Flow Matching方法,在保持高质量输出的同时大幅提升计算效率,为多模态AI创作开辟了全新道路,有望在教育、媒体、设计等领域带来革命性应用。

MIT和哈佛团队重新定义AI图像生成:告别传统时间依赖,迎来"平衡匹配"新纪元

MIT和哈佛团队重新定义AI图像生成:告别传统时间依赖,迎来"平衡匹配"新纪元

MIT和哈佛研究团队提出"平衡匹配"新方法,彻底改变AI图像生成理念。该方法摒弃传统时间依赖机制,创建能量景观让图像自然生成,在ImageNet测试中达到1.90最佳FID分数,节省60%计算资源,具备部分噪声处理、异常检测和图像合成等独特能力,为生成建模领域开辟新范式。

ELLIS研究院重大发现:AI模型训练中的"隐藏开关"让量化压缩效果天差地别

ELLIS研究院重大发现:AI模型训练中的"隐藏开关"让量化压缩效果天差地别

这项研究发现AI模型量化压缩效果的关键影响因素不是训练数据规模,而是学习率调度策略。当训练中学习率衰减时,量化误差会急剧上升。通过优化学习率调度和采用权重平均技术,可显著改善量化性能,为AI模型高效部署提供新思路。

谷歌地图接入Gemini AI 打造全知智能助手

谷歌地图接入Gemini AI 打造全知智能助手

谷歌地图将集成Gemini人工智能技术,旨在将其升级为一个"全知型副驾驶"助手。这一整合将大幅提升地图服务的智能化水平,为用户提供更加个性化和全面的导航体验。通过AI技术的加持,谷歌地图有望在路线规划、地点推荐和实时信息服务等方面实现重大突破。

微软构建虚假市场测试AI智能体,结果暴露意外缺陷

微软构建虚假市场测试AI智能体,结果暴露意外缺陷

微软研究人员发布新的仿真环境来测试AI智能体,研究显示当前智能体模型容易受到操纵。该名为"Magentic Marketplace"的合成平台让客户智能体与商家智能体进行交互实验。测试包括GPT-4o、GPT-5和Gemini-2.5-Flash等模型,发现智能体在面临过多选择时效率下降,且在协作方面表现不佳。研究揭示了AI智能体在无监督环境下的性能问题。

Perplexity展示如何在老旧GPU和AWS网络上高效运行大型AI模型

Perplexity展示如何在老旧GPU和AWS网络上高效运行大型AI模型

AI搜索提供商Perplexity开发了新的软件优化技术,让万亿参数大模型能在老旧、便宜的硬件上高效运行,包括使用亚马逊专有的弹性网络适配器。这项创新解决了大规模专家混合模型面临的内存和网络延迟挑战。研究显示,相比单节点配置,优化后的核心程序在多节点部署中实现了显著性能提升,使企业能更长时间利用现有硬件,或使用折扣云实例运行下一代前沿模型。

企业AI应用的四个关键策略:从随机试验到深度整合

企业AI应用的四个关键策略:从随机试验到深度整合

多数企业已从AI试点阶段转向可重复、可衡量的业务实践。Walgreens通过建立AI卓越中心实现有序创新,FMOL Health将ROI扩展到医生和患者满意度等非财务指标,Steelcase通过数据治理委员会建立AI信任框架,ZoomInfo让员工自主构建AI智能体实现人机协作。这些经验表明,成功的AI战略需要在创新与治理、自动化与人工判断之间找到平衡。

Stream Ring:这枚智能戒指能悄悄记录你的想法

Stream Ring:这枚智能戒指能悄悄记录你的想法

Sandbar公司推出Stream Ring智能戒指,专为随时记录灵感而设计。用户只需轻触戒指并轻声说话,即可将想法转录为笔记。该产品采用个性化数字语音技术,创造如自言自语般的体验。不同于传统AI助手,Stream Ring专注于认知扩展而非替代思考。产品配备全天候电池,支持私密范围内的语音识别。银色版售价249美元,金色版299美元,计划2026年夏季发货。

Alphabet正转变策略:将"登月项目"作为独立公司推向市场

Alphabet正转变策略:将"登月项目"作为独立公司推向市场

Alphabet旗下X实验室负责人泰勒透露,该公司正改变雄心勃勃技术项目的市场化策略,越来越多地将其拆分为独立公司而非保留在Alphabet体系内。这一策略依赖专门的风险基金Series X Capital,该基金已筹集超5亿美元,专门投资X实验室分拆项目。X实验室定义的月球计划需具备三要素:解决世界重大问题、提出相应产品或服务方案、利用突破性技术创造解决希望。

企业构建可信赖AI为何如此关键

企业构建可信赖AI为何如此关键

许多企业在急于采用AI时跳过了最重要的步骤:明确要解决的问题。Experian首席数据技术官强调,企业AI的真正工作不在于模型本身,而在于基础架构。从确保模型漂移检测、合规自动化到管理提示注入风险和用户治理,负责任AI的未来取决于幕后工作。成功始于扎实的工作流程、明确的目标和快速试错的文化。

当AI遇到散点图:Feedzai团队首次揭秘机器如何"读懂"数据可视化

当AI遇到散点图:Feedzai团队首次揭秘机器如何"读懂"数据可视化

Feedzai团队首次系统评估了AI模型理解散点图的能力,创建了包含18,000张图表的大规模数据集。测试十个先进AI模型发现,在简单计数任务中部分模型准确率超90%,但精确定位任务表现不佳,准确率多在50%以下。研究还发现图表设计对AI性能有轻微影响,为AI辅助数据分析提供了重要参考。

加州大学圣芭芭拉分校团队突破:让AI自己修改演示文稿,从粗糙到精美只需几分钟

加州大学圣芭芭拉分校团队突破:让AI自己修改演示文稿,从粗糙到精美只需几分钟

加州大学圣芭芭拉分校研究团队开发了EvoPresent系统,这是首个具备自我改进能力的AI演示文稿制作框架。该系统通过四个AI代理协作和PresAesth美学评估模型,能够自动将学术论文转换为高质量演示文稿,并通过迭代优化持续改进设计效果,在多项评估指标上显著优于现有方法。

人工智能"学生"的学习怎么这么奇怪?小模型在学编程推理时竟然先变笨再变聪明

人工智能"学生"的学习怎么这么奇怪?小模型在学编程推理时竟然先变笨再变聪明

Collinear公司研究团队发现了AI学习编程推理的"谷地"现象:小型AI模型在接受大型模型指导时,性能先下降50%再上升,最终超越初始水平100%。研究还发现,训练数据中答案的正确性对学习效果无影响,但简单题比复杂题的训练效果显著更好。这项发表于NeurIPS 2025的研究为AI训练策略提供了新见解。

新加坡国立大学推出MixReasoning:让AI像人一样"该动脑时动脑,该偷懒时偷懒"

新加坡国立大学推出MixReasoning:让AI像人一样"该动脑时动脑,该偷懒时偷懒"

新加坡国立大学研究团队开发了MixReasoning技术,让AI能够像人类一样智能地选择推理深度。该技术通过监测AI的不确定性程度,自动在详细推理和简洁回答之间切换,解决了当前AI模型冗长推理的效率问题。在数学推理测试中,MixReasoning在保持甚至提升准确率的同时,将推理长度减少了20-50%,为AI推理优化提供了新思路。

如何让计算机和人像朋友一样聊天?香港大学团队打造史上最复杂的数据库对话系统评测平台

如何让计算机和人像朋友一样聊天?香港大学团队打造史上最复杂的数据库对话系统评测平台

香港大学团队开发的BIRD-INTERACT平台首次真实模拟了人机数据库对话的复杂性,通过900个交互任务和智能用户模拟器,揭示了即使GPT-5等先进AI在复杂对话场景中仍表现不佳的现实,为提升AI系统的交互沟通能力指明了方向。

阿伯丁大学团队揭秘:AI大模型为什么会"一本正经地胡说八道"?

阿伯丁大学团队揭秘:AI大模型为什么会"一本正经地胡说八道"?

阿伯丁大学研究团队开发了"分布式语义追踪"技术,深入AI内部发现其"幻觉"源于快速联想系统与慢速推理系统的冲突。研究识别出AI推理的"不归点"和"推理捷径劫持"现象,揭示了预防AI错误的新方法,为构建更可靠的AI系统提供了重要理论基础和实践工具。