人工智能 关键字列表
北京交通大学团队推出首个多图像定位AI,让机器像人一样"举一反三"找目标

北京交通大学团队推出首个多图像定位AI,让机器像人一样"举一反三"找目标

北京交通大学等机构联合开发出首个多图像视觉定位AI模型Migician,能像人类一样在多张图片中精确定位目标物体。该模型平均准确率达63.82%,比同类AI高出25个百分点,在自动驾驶、安防监控、医疗影像等领域具有广泛应用前景。研究团队构建了63万样本数据库和全面测试平台,并将所有资源开源,为多模态AI发展开辟新方向。

强化学习遇上变形金刚:田纳西理工大学发现AI自学的秘密

强化学习遇上变形金刚:田纳西理工大学发现AI自学的秘密

田纳西理工大学研究团队通过结合强化学习和变形金刚架构,成功开发出具备"元学习"能力的AI系统。该系统能在未见过的环境中快速适应并持续改进,展现了900%的性能提升。研究证实AI可进行技能组合、适应环境变化,且对训练数据质量具有显著鲁棒性,为通用人工智能发展指明新方向。

这款会"进化"的手机助手,让智能手机变得前所未有地聪明——伊利诺伊大学联合阿里巴巴推出Mobile-Agent-E

这款会"进化"的手机助手,让智能手机变得前所未有地聪明——伊利诺伊大学联合阿里巴巴推出Mobile-Agent-E

伊利诺伊大学和阿里巴巴联合推出Mobile-Agent-E,这是一款革命性的自我进化手机智能助手。该系统采用分层多智能体架构,能够处理复杂的跨应用任务,更重要的是具备从经验中学习的能力。在新开发的Mobile-Eval-E基准测试中,性能比现有最佳方法提升22.1%。

数字孪生技术为网络安全防御带来预测优势

数字孪生技术为网络安全防御带来预测优势

数字孪生技术正在改变网络安全防御模式,从被动响应转向主动预测。这种实时学习演进的虚拟副本让安全团队能够在威胁发生前预见攻击。组织可以在数字孪生环境中预演明日的攻击,将防御从事后反应转变为事前排演。通过动态更新的IT生态系统副本,团队可在真实条件下压力测试防御体系,模拟零日漏洞攻击并制定应对策略,从根本上重塑网络安全实践方式。

SK海力士完成HBM4开发,为下一代GPU量产做准备

SK海力士完成HBM4开发,为下一代GPU量产做准备

韩国存储巨头SK海力士宣布完成HBM4开发并准备大规模量产,消息推动其股价上涨7%。随着AMD和英伟达的下一代数据中心GPU将采用HBM4技术,高带宽内存已成为AI加速器的核心组件。SK海力士通过将I/O端子数量增至2048个,有效实现了带宽翻倍,能效提升超过40%,运行速度达到10Gb/s。美光和三星也在积极推进HBM4产品开发。

可重构计算:破解数据中心复杂性难题

可重构计算:破解数据中心复杂性难题

AI和高性能计算正重塑各行各业,但数据中心为适应多样化工作负载而添加各种专用加速器,反而导致运营效率下降。专用芯片与CPU、GPU等系统组合产生了前所未有的复杂性,功耗飙升至不可持续水平。随着AI模型规模增长和工作负载边界模糊,传统静态硬件分配已不适用。可重构计算提供了新方案:单一平台可动态调整架构以匹配不同需求,消除芯片间通信瓶颈,降低功耗,简化运营。

英伟达展示Rubin CPX推理性能预览

英伟达展示Rubin CPX推理性能预览

英伟达发布新款Rubin CPX GPU,专为大规模上下文处理而设计,可支持百万级token的软件编程和生成视频。该产品将搭载于Vera Rubin NVL 144 CPX平台,承诺高能效和卓越推理性能,每投资1亿美元可获得50亿美元token收入。同时,英伟达展示了Blackwell Ultra GB300系统的基准测试结果,DeepSeek-R1推理性能较前代提升1.4倍。

诺基亚推出AI优化数据中心网络解决方案

诺基亚推出AI优化数据中心网络解决方案

诺基亚与Supermicro建立战略合作伙伴关系,应对AI和云工作负载对数据中心带来的前所未有的挑战。双方将Supermicro的800G以太网交换平台与诺基亚的SR Linux网络操作系统和事件驱动自动化平台相结合,为AI、高性能计算和云环境提供完全集成的数据中心网络解决方案。该方案可实现从设计、部署到日常运营的全生命周期自动化,减少部署时间,降低运营成本,提高整体效率。

梅赛德斯-奔驰推出AI驱动的全电动GLC车型

梅赛德斯-奔驰推出AI驱动的全电动GLC车型

奔驰在慕尼黑IAA展会上发布全电动GLC车型,搭载高通骁龙数字底盘解决方案。新车续航里程达713公里,零排放。该车型配备先进数字座舱,集成AI语音交互、3D增强现实导航和杜比全景声等功能。系统能学习用户偏好,提供个性化推荐和免提交互体验。内置5G连接支持车辆与云端实时数据传输。

思科Splunk大会:智能体驱动的SOC安全运营愿景正式发布

思科Splunk大会:智能体驱动的SOC安全运营愿景正式发布

在Splunk年度会议上,该公司发布两款基于智能代理的安全运营工具。Splunk Enterprise Security基础版和高级版统一了威胁检测、调查和响应工作流程。新功能将智能代理AI置于SOC核心,通过内置AI减少警报噪音,将调查时间从数小时缩短至数分钟。Cisco计划发布更多AI功能支持智能代理SOC,包括安全警报分类、恶意软件逆向分析、剧本创作等能力,让网络安全专业人员专注于更具战略性的工作。

PEC 2025 AI创新者大会暨第二届提示工程峰会启幕,叩问AGI前夜关键命题

PEC 2025 AI创新者大会暨第二届提示工程峰会启幕,叩问AGI前夜关键命题

9月13日,由PEC China、至顶科技、软积木主办的PEC 2025 AI创新者大会暨第二届提示工程峰会在北京成功举办。

让AI推理像人一样思考,但又要快得多:中山大学团队的"智能剪刀"如何给O1模型瘦身

让AI推理像人一样思考,但又要快得多:中山大学团队的"智能剪刀"如何给O1模型瘦身

中山大学团队针对OpenAI O1等长思考推理模型存在的"长度不和谐"问题,提出了O1-Pruner优化方法。该方法通过长度-和谐奖励机制和强化学习训练,成功将模型推理长度缩短30-40%,同时保持甚至提升准确率,显著降低了推理时间和计算成本,为高效AI推理提供了新的解决方案。

视觉语言模型在自动驾驶中的可靠性大考验:上海AI实验室深度揭秘AI司机的真实水平

视觉语言模型在自动驾驶中的可靠性大考验:上海AI实验室深度揭秘AI司机的真实水平

上海AI实验室研究团队深入调查了12种先进视觉语言模型在自动驾驶场景中的真实表现,发现这些AI系统经常在缺乏真实视觉理解的情况下生成看似合理的驾驶解释。通过DriveBench测试平台的全面评估,研究揭示了现有评估方法的重大缺陷,并为开发更可靠的AI驾驶系统提供了重要指导。

谷歌发布Learn-by-interact:让AI智能体像小孩学走路一样自我进化的突破性方法

谷歌发布Learn-by-interact:让AI智能体像小孩学走路一样自我进化的突破性方法

谷歌和香港大学研究团队提出Learn-by-interact框架,让AI智能体通过自主与环境互动来学习,核心创新是"逆向构建"机制,能将失败操作转化为有价值训练数据。在四个真实环境测试中,该方法显著提升了AI在软件编程、网页操作、桌面应用等复杂任务中的表现,为构建实用AI助手开辟新路径。

TransPixeler:让透明视频生成变成现实,Adobe研究院破解RGBA视频生成难题

TransPixeler:让透明视频生成变成现实,Adobe研究院破解RGBA视频生成难题

TransPixeler是由香港科技大学和Adobe研究院联合开发的AI视频生成技术,专门解决生成带透明效果(RGBA)视频的难题。该技术巧妙扩展现有视频生成模型,让AI能同时生成RGB颜色和Alpha透明度信息,避免了传统"先生成后提取"方法的缺陷。通过精心设计的注意力机制和训练策略,TransPixeler在有限数据下实现了高质量透明视频生成,为电影特效、游戏开发、VR/AR等领域提供了强大工具。

腾讯混元团队重磅发现:训练AI大模型时,浮点数的"配方"原来大有讲究!

腾讯混元团队重磅发现:训练AI大模型时,浮点数的"配方"原来大有讲究!

腾讯混元团队通过366组实验发现了AI大模型低精度训练的关键规律,提出Capybara缩放定律。研究揭示指数位比尾数位更重要,存在训练数据临界值现象,4-8位精度具有最佳成本效益。该成果为AI训练提供精确预测工具,有助于降低训练成本、提升效率,推动AI技术普及化发展。

阿里巴巴研究团队突破:让AI像程序员一样"检查代码"来纠正自己的错误

阿里巴巴研究团队突破:让AI像程序员一样"检查代码"来纠正自己的错误

阿里巴巴研究团队开发出ProgCo方法,让AI像程序员一样生成验证程序来检查和纠正自己的答案。该方法在数学问题和指令遵循任务上表现卓越,准确率提升超过7%,同时具有比传统方法更高的计算效率,为AI自我纠错开辟了新的技术路径。

南洋理工大学团队突破性发现:AI观看教学视频能否真正学会知识?

南洋理工大学团队突破性发现:AI观看教学视频能否真正学会知识?

南洋理工大学研究团队构建了Video-MMMU基准,通过300个专业教学视频和900道问题,评估AI模型从视频中学习知识的能力。研究发现人类专家知识增益达33.1%,而最先进的AI模型仅达15.6%,特别在知识适应新场景方面表现不佳。该研究揭示了当前AI在真正理解和应用知识方面的局限性,为未来AI教育应用发展指明了方向。

AI语音助手为什么总是答非所求?港中深研究团队发现问题根源并给出解决方案

AI语音助手为什么总是答非所求?港中深研究团队发现问题根源并给出解决方案

港中深研究团队发现语音AI系统"答非所问"的根本原因在于声学和语义理解的认知鸿沟,并提出EchoX解决方案。通过创新的"回声训练"方法,EchoX用仅6千小时训练数据就在知识问答任务中取得显著性能提升,综合得分46.3分超越主流系统,为语音AI发展指明新方向。

ByteDance智能创作实验室与清华大学联手:让任何人都能制作电影级说话视频

ByteDance智能创作实验室与清华大学联手:让任何人都能制作电影级说话视频

ByteDance智能创作实验室与清华大学联合发布HuMo系统,这是首个实现文字、图片、音频三模态协同控制的人物视频生成框架。该系统通过创新的渐进式训练方法和时间自适应引导策略,让用户仅需提供文字描述、参考照片和音频就能生成电影级说话视频,在多项评测中超越现有专业系统,为内容创作带来革命性突破。