人工智能 关键字列表
中山大学与Adobe联手突破!AI生成图片"失真"难题终被攻克,这项技术让你的参考图细节原封不动地保留下来

中山大学与Adobe联手突破!AI生成图片"失真"难题终被攻克,这项技术让你的参考图细节原封不动地保留下来

研究团队提出RefGC-SR?,让AI生成图像在完成后利用原始高清参考图同步修复伪影并提升分辨率,填补了现有技术只能二选一的空白。

新加坡国立大学、复旦大学、北京大学、字节跳动联合研究:当AI学会"管理自己的经验",一个9B小模型是如何挑战4000亿参数巨兽的?

新加坡国立大学、复旦大学、北京大学、字节跳动联合研究:当AI学会"管理自己的经验",一个9B小模型是如何挑战4000亿参数巨兽的?

OPD-Evolver是一个让AI学会"经验性成长"的训练框架,通过精确测量每条记忆的实际价值,训练AI同时掌握选择、使用、写入和管理经验四种能力,让90亿参数模型挑战近4000亿参数巨头。

南洋理工大学让AI图像生成"只看有用的部分"——一种几乎零成本的训练加速新思路

南洋理工大学让AI图像生成"只看有用的部分"——一种几乎零成本的训练加速新思路

南洋理工大学研究团队提出频谱强制(Spectral Forcing),通过动态低通滤镜减少扩散模型训练中的无效计算,在ImageNet-256上将FID提升14.5%,几乎不增加计算成本。

北航、北人大等高校联合IQuest研究团队:只需"多想一遍",7B小模型如何在代码任务上打败数百亿参数的大模型?

北航、北人大等高校联合IQuest研究团队:只需"多想一遍",7B小模型如何在代码任务上打败数百亿参数的大模型?

这项研究发现,7B参数的循环推理模型只需"多想一遍"(循环2次)就能在代码任务上超越数倍大的模型,但再多想反而退步,揭示了循环次数存在明确饱和点的机制原因。

四川大学与华为2012实验室联手揭秘:为什么AI做逻辑题时"中文版"会突然变笨?

四川大学与华为2012实验室联手揭秘:为什么AI做逻辑题时"中文版"会突然变笨?

研究团队构建了名为CHLOGIC的中英文对齐逻辑推理基准,系统测试了大语言模型在英文与多种中文表达之间的逻辑一致性,揭示了AI中文逻辑推理的持续性能差距。

MIT与MIT-IBM沃森AI实验室的工程师,是如何让AI大脑"中间瘦两头胖"反而更聪明的?

MIT与MIT-IBM沃森AI实验室的工程师,是如何让AI大脑"中间瘦两头胖"反而更聪明的?

MIT与MIT-IBM实验室提出"×形"可变宽度变换器架构><former,两端宽中间窄,在参数量相同情况下性能更优、计算量和KV缓存均减少约10%。

当AI"侦探"遇到多语言证据:早稻田大学等机构联合揭示跨语言深度研究的致命盲点

当AI"侦探"遇到多语言证据:早稻田大学等机构联合揭示跨语言深度研究的致命盲点

研究发现AI深度研究智能体在面对外语证据时正确率大幅下降,揭示了跨语言检索和跨语言推理两道独立瓶颈,为多语言AI评估提供新基准。

北京大学出手,让AI真正"懂"人体动作:一套双流编码技术让机器人动得更像人

北京大学出手,让AI真正"懂"人体动作:一套双流编码技术让机器人动得更像人

北京大学提出MotionVLA,用双流频域编码分离人体动作的姿态信号与速度信号,显著减少生成动作中的脚滑和抖动,并在真实人形机器人上完成部署验证。

当AI"助手"遇上海量训练数据:弗吉尼亚理工大学等机构揭示智能体自动化数据筛选的潜力与局限

当AI"助手"遇上海量训练数据:弗吉尼亚理工大学等机构揭示智能体自动化数据筛选的潜力与局限

这项多机构联合研究提出CURATION-BENCH框架,测试通用AI编程智能体能否自主完成训练数据策展的迭代探索,发现智能体执行可靠但探索浅层,搭配论文方法改造脚手架后可突破人类设计基准。

思科系统公司研发出会"看病"的Wi-Fi路由器:让网络故障在你发现之前就被悄悄修好

思科系统公司研发出会"看病"的Wi-Fi路由器:让网络故障在你发现之前就被悄悄修好

APEX是思科开发的网络原生AI模型,专为Wi-Fi接入点设计,可在本地预测DHCP故障并检测网络异常,无需上传原始数据,预测精度超越现有通用基础模型。

威斯康星大学的这项研究,让AI视觉模型终于学会了"精准说数字"

威斯康星大学麦迪逊分校提出DRIFT框架,通过"粗预测+流匹配残差精化"的两步策略,让视觉语言模型在视频时间定位和机器人控制任务中实现精准连续数值输出,多项基准测试达到最优水平。

Pixi 发布 iOS 新应用,让短信变身互动 AR 体验

Pixi 发布 iOS 新应用,让短信变身互动 AR 体验

Pixi正式在App Store推出一款基于iMessage的AR消息应用,用户可发送由设备端AI驱动的AR角色。这些角色能通过iPhone摄像头感知周围环境,实时与人互动,例如虚拟猫会对真实路过的狗做出反应,且所有视觉与音频处理均在本地完成以保护隐私。应用目前提供机器人、猫和动态信封等角色,未来计划开放创作者市场及用户自定义角色功能,并将扩展至Android及WhatsApp等平台。

OpenAI收购Ona,为企业级智能体部署提供安全保障

OpenAI收购Ona,为企业级智能体部署提供安全保障

OpenAI宣布收购拥有79人团队的云开发环境提供商Ona(前身为Gitpod),以加速推动智能体AI的企业级落地。Ona的技术可为AI智能体提供安全、持久的云端运行环境,支持跨设备持续工作、访问控制、日志管理和凭证管理等企业级治理能力。分析人士认为,此次收购是OpenAI应对Anthropic Claude Code竞争压力的战略举措,同时也填补了Codex在企业安全部署方面的短板。IDC估计此次收购价格约为4.5亿至5亿美元。

英国CMA对谷歌搜索排名实施公平性新规

英国CMA对谷歌搜索排名实施公平性新规

英国竞争与市场管理局(CMA)依据数字市场竞争机制,正式认定谷歌具有"战略市场地位",并对其提出公平排名要求。谷歌须以客观、非歧视性标准对自然搜索结果及AI摘要进行排名,提前告知重大算法变更,并建立企业投诉渠道。同时,CMA要求谷歌通过数据可携带API向第三方开放用户搜索数据,支持个性化推荐、旅行建议及购物优惠等创新服务的开发,以促进市场公平竞争与技术创新。

英国金融机构将新兴技术投资列为首要增长优先级

英国金融机构将新兴技术投资列为首要增长优先级

根据劳埃德银行连续10年开展的金融机构情绪调查,新兴技术投资首次成为英国金融机构的首要增长优先项。调查显示,77%的受访者将新兴技术投资视为增长重点,远高于去年的41%;93%的受访者认为AI是未来五年影响最大的技术。劳埃德银行正大力推进AI布局,计划今年内通过其AI学院对全体6.7万名员工开展AI培训。

Graitec发布面向工程建筑行业的AI可信路线图

Graitec发布面向工程建筑行业的AI可信路线图

软件提供商Graitec推出针对建筑、工程、施工与运营(AECO)行业的三阶段AI战略。该路线图分别聚焦AI辅助工作流、工作流自动化及自动生成符合规范的设计方案。公司强调,AI生成内容的可信度与可审计性才是行业核心挑战,并将AI直接嵌入工程与制造流程中,结合确定性计算引擎确保设计符合标准法规。Graitec拥有40年领域积累,计划通过"左移"策略让AI更早介入项目生命周期,从而减少返工与制造错误。

两款AI智能体在临床决策中的表现超越医生

两款AI智能体在临床决策中的表现超越医生

两项发表于《自然》期刊的研究显示,德国学术团队开发的MIRA与谷歌的AMIE两款AI智能体,在虚拟测试中已能媲美甚至超越医生的临床决策能力。MIRA在胰腺炎等多项诊断任务及手术流程管理上表现突出,99.8%的用药建议被评为正确;AMIE生成的治疗方案在多项指标上优于初级保健医生。但研究人员强调,两者目前仍需在前瞻性研究中进一步验证,尚不具备真实临床应用条件。

混合键合如何实现数十亿级芯片互连

混合键合如何实现数十亿级芯片互连

混合键合技术可在单个封装中实现数十亿乃至数万亿个连接点。以1μm节距为例,一个典型处理器封装的连接总数可超过267亿个。面对如此规模,逐一检测已不现实,良率管控依赖极高的工艺一致性。介电材料选择、铜扩散控制、晶圆厚度均匀性等均是关键挑战。内建自测试(BiST)机制与冗余修复架构成为保障可靠性的核心手段,集群化I/O设计可实现键合前后的独立电气测试。

物理边缘的AI工程化部署:挑战与机遇

物理边缘的AI工程化部署:挑战与机遇

随着AI从云端洞察向真实世界行动演进,企业正面临如何在物理环境中规模化部署智能的挑战。物理AI不同于纯软件AI,需在安全关键、高度监管的复杂环境中可靠运行,容错率极低。规模化落地的最大障碍往往不是模型本身,而是数据质量、遗留系统集成与基础设施。边缘AI、生成式AI与自主智能体的融合正成为趋势,但成功的关键在于可重复架构、全栈工程能力与清晰的安全边界。

氮化镓功率器件迈向垂直架构新阶段

氮化镓功率器件迈向垂直架构新阶段

氮化镓(GaN)在高压功率应用中理论性能优越,但受限于衬底材料质量,商业化进展缓慢。高压应用需要垂直器件设计,而这依赖高质量GaN同质衬底或工程衬底。近年来,GaN外延生长技术取得进展,QST等工程衬底显著改善了材料质量。在掺杂与栅介质工艺上,研究人员也取得突破,沟槽栅MOSFET等垂直器件设计已验证千伏级击穿电压。但整体工艺成熟度尚不足以挑战硅和碳化硅的市场地位。