人工智能 关键字列表
Anthropic最新CJE技术:让AI评判AI不再瞎猜,终结LLM评估乱象

Anthropic最新CJE技术:让AI评判AI不再瞎猜,终结LLM评估乱象

这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。

东京大学等机构联手打造Mio:全球首个具备"交互智能"的数字人类

东京大学等机构联手打造Mio:全球首个具备"交互智能"的数字人类

这项由东京山田AI研究院领导的突破性研究,首次实现了具备"交互智能"的数字人类Mio。该系统通过五个核心模块的协同工作,让数字人类具备了真正的理解、学习和成长能力,而不仅仅是外表的模仿。研究团队提出了全新的评估标准Interactive Intelligence Score,Mio获得76.0分,相比现有技术提升8.4分,标志着数字人类从被动播放向主动智能交互的历史性转变。

当AI画师只会画"美图":UBC研究揭示图像生成模型的美学偏见陷阱

当AI画师只会画"美图":UBC研究揭示图像生成模型的美学偏见陷阱

英属哥伦比亚大学研究团队发现,当前主流AI图像生成模型存在严重的美学偏见,过度追求"普遍美感"导致无法执行用户的反美学创作意图。研究通过构建300个反美学提示词数据集,测试发现经过美学对齐的模型会自动"美化"输出,即使用户明确要求生成低质量或"丑陋"图像。这种偏见不仅限制了艺术表达多样性,还可能构成无意识的创作审查,威胁文化多元化发展。

华中科技大学与MiniMax联手突破:让AI画画的"眼睛"更懂艺术的秘密

华中科技大学与MiniMax联手突破:让AI画画的"眼睛"更懂艺术的秘密

华中科技大学与MiniMax联合研究团队在2025年12月发表重要论文,提出VTP视觉标记器训练框架。该研究解决了AI绘画系统中的关键问题:传统训练只注重像素复制而忽视语义理解,导致扩展性差。VTP通过整合图片重建、图文对比学习和自监督学习三种任务,让AI既能准确重现细节又能理解深层含义。实验显示VTP具有优秀扩展性,投入十倍计算资源可获得65.8%性能提升,为AI绘画技术带来突破性进展。

苹果公司首次实现"读心术":让大脑直接控制AI聊天机器人

苹果公司首次实现"读心术":让大脑直接控制AI聊天机器人

苹果公司研究团队在2024年12月发表了突破性研究成果,首次实现用大脑信号直接控制AI聊天机器人进行自然对话。这项技术通过"思维解码器"系统捕捉大脑电信号并转换为文字,让AI代替用户表达想法,准确率超过85%。该技术将为失语患者带来重新交流的希望,并可能彻底改变人机交互方式,开启"思维计算"新时代。

微信AI团队创新突破:像人类一样"记忆"全局的智能问答系统

微信AI团队创新突破:像人类一样"记忆"全局的智能问答系统

中科院信息工程研究所与腾讯微信AI团队等机构联合开发出首个具备"全局记忆"的智能问答系统Mindscape-Aware RAG,模仿人类阅读时构建心智地图的认知机制。系统通过分层摘要建立文档全局记忆,结合全局感知检索器和生成器,在长文本理解任务中显著超越传统方法,140亿参数模型性能甚至超过720亿参数传统系统。

阿里巴巴推出MAI-UI:让手机像人类助手一样智能操作的革命性技术

阿里巴巴推出MAI-UI:让手机像人类助手一样智能操作的革命性技术

阿里巴巴通义实验室发布MAI-UI,这是一套革命性的手机AI操作技术。该技术能让AI像人类助手一样理解屏幕、与用户对话、使用外部工具,并实现本地云端智能协作。在测试中,MAI-UI在视觉识别上达到73.5%准确率,在复杂任务执行上达到76.7%成功率,全面超越现有竞品,标志着手机智能交互进入新时代。

CIO对2026年AI发展的五大预测

CIO对2026年AI发展的五大预测

2025年,企业技术高管面临巨大压力,需要帮助企业从持续的AI投入中获得回报。大多数高管取得了进展,完善了项目优先级排序方法。然而,CIO仍面临AI相关问题。支离破裂的AI监管环境和宏观经济阻力将继续推动技术高管保持谨慎态度。随着AI采用增长的影响不断显现,一些CIO预期明年将带来劳动力策略变化。

亚马逊AI负责人离职,引发领导层重大调整

亚马逊AI负责人离职,引发领导层重大调整

亚马逊CEO贾西宣布,AWS实用计算产品高级副总裁彼得·德桑蒂斯将领导新的AI组织,专注于Nova模型发展、定制芯片开发和量子计算。作为领导层变动的一部分,德桑蒂斯将接管人工通用智能团队,原负责人罗希特·普拉萨德将于2025年底离职。新组织还包括皮特·阿贝尔领导前沿模型研究团队。

CIOs将AI采纳列为首要任务:调查报告

CIOs将AI采纳列为首要任务:调查报告

最新调查显示,近半数CIO将AI采用和自动化提升列为未来五年的首要任务。超过三分之一的受访者将加强业务连续性和灾难恢复作为重点,同等比例的企业将人才技能发展列为优先事项。尽管AI投资成为焦点,但投资回报率仍不明朗,近三分之二的商业领袖估计AI投资回报率仅为50%或更低。

红帽收购Chatterbox Labs加强AI治理能力

红帽收购Chatterbox Labs加强AI治理能力

红帽公司宣布收购伦敦AI公司Chatterbox Labs,该公司专注于模型测试和生成式AI护栏技术。此次收购将为红帽AI产品组合增加自动化AI风险评估、安全测试和治理功能。Chatterbox Labs的AI风险指标帮助企业验证数据和模型是否符合国际法规,提供模型无关的稳健性、公平性和可解释性测试。收购将增强红帽的AI安全能力,包括生成式AI护栏、模型透明度和预测性AI验证等功能。

微软和谷歌主导企业AI供应商市场

微软和谷歌主导企业AI供应商市场

根据Gartner最新报告,微软凭借广泛的合作伙伴和平台生态系统在企业级AI领域占据主导地位,而谷歌凭借集成的AI代理技术栈和可扩展的企业采用支持在企业代理AI方面领先。报告涵盖近30个AI技术竞赛领域,包括数据基础设施、模型代理、行业解决方案和网络安全等类别。尽管科技巨头投入数十亿资金扩展AI基础设施,但企业仍在努力证明AI技术的商业价值,超过三分之二的企业困于生成式AI试点阶段。

微软亚洲研究院联手清华大学:让AI看图不再"雾里看花"的双向感知新技术

微软亚洲研究院联手清华大学:让AI看图不再"雾里看花"的双向感知新技术

微软亚洲研究院与清华大学联合提出双向感知塑造技术,通过创新的两阶段训练方法解决AI视觉理解中的关键问题。该技术让AI学会正确聚焦重要视觉信息,避免被无关内容误导。仅用1.3万训练样本就在八个基准测试中平均提升8.2%性能,超越使用数十万样本的专门模型,为AI视觉推理能力提升开辟新路径。

上海交大团队突破大语言模型实时推理难题:让AI在时间限制内既快又准

上海交大团队突破大语言模型实时推理难题:让AI在时间限制内既快又准

上海交通大学研究团队开发了TimeBill框架,解决大语言模型在实时应用中的时间不确定性问题。该系统通过精确预测回答长度和执行时间,动态调整AI记忆管理策略,确保在规定时间内完成任务的同时保持回答质量。实验显示TimeBill在各种时间预算下都能实现最佳的完成率与性能平衡,为AI在自动驾驶、工业控制等安全关键领域的应用提供了重要技术支撑。

中山大学团队发明AI图像编辑"黑科技":让修图不再"误伤"背景

中山大学团队发明AI图像编辑"黑科技":让修图不再"误伤"背景

中山大学研究团队开发了名为ProEdit的AI图像编辑新技术,解决了传统方法在编辑图片时经常"误伤"背景的问题。该技术通过KV-Mix和Latents-Shift两个核心模块,能够精准修改目标区域而完美保持背景不变,支持图片和视频编辑,具有即插即用的特点,可集成到现有各种编辑工具中,大幅提升编辑效果。

香港科技大学和阿里巴巴联合发布SWE-RM:让AI写代码像老师改作业一样精准打分

香港科技大学和阿里巴巴联合发布SWE-RM:让AI写代码像老师改作业一样精准打分

由香港科技大学和阿里巴巴通义千问团队联合开发的SWE-RM,是首个能够全面评估AI代码质量的执行无关反馈系统。该系统突破了传统二元评分局限,具备准确选择最优解、全面区分代码质量和可靠分数校准三大核心能力。在SWE-Bench Verified测试中,SWE-RM将模型成功率从51.6%提升至62.0%,达到开源模型最佳性能,为AI编程学习和软件开发质量评估提供了重要技术突破。

上海AI实验室打造"视觉多面手":让机器像人一样全方位理解图像美感、质量与结构

上海AI实验室打造"视觉多面手":让机器像人一样全方位理解图像美感、质量与结构

上海AI实验室团队首次提出统一的感知层面图像理解框架UniPercept,让AI能像人类一样从美学、质量和结构三个维度全方位评估图像。研究构建了包含6000张精标注图像的基准数据集,训练出的模型在各项测试中显著超越现有专门化系统,并成功应用于图像生成模型优化。这项技术为降低视觉内容创作门槛、提升AI视觉理解能力提供了重要突破。

上海AI实验室和同济大学联手打造天气界的ChatGPT:一个AI模型搞定所有天气问题

上海AI实验室和同济大学联手打造天气界的ChatGPT:一个AI模型搞定所有天气问题

由上海AI实验室等机构联合开发的Omni-Weather是首个统一的多模态天气AI模型,能同时进行天气预测和理解分析。该模型集成了雷达预测、图像生成、数据理解等四大功能,并创新性地引入思维链技术,让AI能像气象专家一样解释推理过程。实验显示其性能全面超越现有专业化模型,为天气AI发展开辟了新方向。

新加坡国大开创幻灯片生成新时代:让AI秒懂你的展示风格偏好

新加坡国大开创幻灯片生成新时代:让AI秒懂你的展示风格偏好

新加坡国立大学团队开发的SlideTailor系统首次实现了AI幻灯片的个性化生成,通过分析用户的历史样例和模板偏好来学习个人风格,无需复杂设置即可自动创建符合用户习惯的高质量演示文稿,并创新性地引入言语链机制同步生成演讲稿,为智能内容创作开辟了新方向。

美国NIST发布人工智能网络安全框架指南草案

美国NIST发布人工智能网络安全框架指南草案

美国国家标准与技术研究院发布人工智能网络安全框架配置文件草案,旨在帮助组织安全使用AI系统。该文件围绕"安全"、"防御"和"阻止"三个重点领域,详细说明如何管理不同AI系统的网络安全挑战、利用AI增强网络防御能力以及阻止AI驱动的网络攻击。文件将网络安全框架的各个组件映射到具体建议上,覆盖入侵检测到供应链安全等各个方面。