人工智能 关键字列表
韩国大学团队破解AI绘画"胡言乱语"难题:让机器画出更真实的图像

韩国大学团队破解AI绘画"胡言乱语"难题:让机器画出更真实的图像

韩国大学等机构研究团队提出TAG方法,解决AI绘画中的"幻觉"问题。该方法通过放大扩散过程中的切线分量来引导AI生成更真实图像,无需重训练模型且计算成本极低。实验显示TAG能显著改善图像质量,减少不合理细节如多指手等,同时可与现有引导技术结合使用,为AI绘画领域提供了简单有效的优化方案。

无人看守的AI"审稿员"来了:蒙特利尔大学团队能否让论文评审变得更公平?

无人看守的AI"审稿员"来了:蒙特利尔大学团队能否让论文评审变得更公平?

蒙特利尔大学研究团队开发的ReviewerToo系统通过多样化AI审稿员模拟真实学术评审流程,在1963篇ICLR论文测试中达到81.8%准确率,接近人类平均水平83.9%。该系统设计了理论型、实证型等不同"性格"的AI审稿员,并集成文献综述、作者答辩等完整评审环节,为解决学术界面临的评审规模化挑战提供了可行方案。

MIT联手英伟达:让AI看懂无限长视频,告别卡顿和遗忘

MIT联手英伟达:让AI看懂无限长视频,告别卡顿和遗忘

MIT联手英伟达突破AI视频理解瓶颈,开发出能处理无限长视频的StreamingVLM模型。该技术采用创新的三层记忆管理策略,实现实时视频解说而不会卡顿或遗忘。在超过2小时的测试中胜过GPT-4o,为自动驾驶、智能监控、在线教育等领域开辟新可能。

微软和哥伦比亚大学联手开发AI"预知"系统:让机器像人一样先想后行

微软和哥伦比亚大学联手开发AI"预知"系统:让机器像人一样先想后行

微软和哥伦比亚大学联合开发了名为Dyna-Mind的AI训练框架,通过两阶段训练教会AI进行"心理模拟"。该框架让AI学会在行动前进行虚拟试错,显著提升了在复杂规划任务中的表现。在推箱子、虚拟家庭任务和安卓设备操作等测试中,成功率分别达到82.5%、92.5%和40.7%,远超传统方法。这项研究为开发更智能的AI助手奠定了基础。

普渡大学首创对话式评分系统:让AI像老师一样给学生打分

普渡大学首创对话式评分系统:让AI像老师一样给学生打分

普渡大学、埃默里大学等机构联合开发的OpenRubrics项目,首次提出了基于结构化评分标准的AI评判系统。该系统将评分过程分为硬性规则和软性原则两层,通过对比学习生成高质量评分标准,在多项基准测试中平均超越同等规模模型6.8%,为构建透明可解释的AI评估系统提供了新方案。

核聚变之谜大破解:奥地利林茨大学团队开发神奇AI让等离子体湍流"预测"变简单

核聚变之谜大破解:奥地利林茨大学团队开发神奇AI让等离子体湍流"预测"变简单

这项由奥地利约翰开普勒大学林茨分校和英国原子能管理局联合完成的研究,开发了名为GyroSwin的AI系统来预测核聚变中的等离子体湍流。该系统首次实现了对五维陀螺动力学方程的神经网络求解,速度比传统方法快数千倍,同时能捕捉传统简化方法忽略的重要物理现象,为核聚变技术的实用化提供了重要突破。

机器人也能变成功夫高手:亚马逊团队让人形机器人学会跑酷和搬重物

机器人也能变成功夫高手:亚马逊团队让人形机器人学会跑酷和搬重物

亚马逊研究团队开发的OmniRetarget系统解决了人形机器人学习人类动作的核心难题。通过创新的"交互网格"技术,该系统能将人类动作精确转换为机器人可执行的指令,同时保持与环境的物理互动关系。训练出的Unitree G1机器人能完成30秒跑酷、墙面翻转等高难度动作,成功率超过82%,且能零调整地从仿真转入现实应用。

Google推出类似苹果私有云计算的AI隐私保护技术

Google推出类似苹果私有云计算的AI隐私保护技术

谷歌推出类似苹果私有云计算的新平台,让用户在享受先进AI功能的同时保护数据隐私。该平台将复杂AI请求转移到云端处理,确保敏感数据仅用户可见,连谷歌也无法访问。随着AI工具需要更强计算能力,这一方案平衡了隐私保护与性能需求。Pixel 10手机将获得更智能的Magic Cue建议和更多语言的录音转录功能。

OpenAI GPT-5.1模型全面升级:个性化交互与推理能力双提升

OpenAI GPT-5.1模型全面升级:个性化交互与推理能力双提升

OpenAI宣布推出GPT-5的首个重大升级版本GPT-5.1,包含Instant和Thinking两个变体。新模型在对话风格上更加自然温暖,具备自适应推理能力,能根据问题复杂度调整思考深度。GPT-5.1提供八种个性化对话模式供用户选择,减少专业术语使用,提升易理解性。该升级旨在解决GPT-5发布后用户反馈的不足,将逐步向订阅用户推出。

思科AI基础设施布局获回报,财报超预期股价大涨

思科AI基础设施布局获回报,财报超预期股价大涨

网络巨头思科发布超预期的第一财季财报,每股收益1美元超出华尔街0.98美元预期,营收148.8亿美元同比增长8%超分析师预估。净利润达28.6亿美元,连续第四个季度营收增长。AI基础设施需求推动核心网络业务营收77亿美元同比增15%。公司推出新款N9100网络交换机支持AI工作负载,超大规模客户AI基础设施订单达13亿美元。股价盘后上涨超7%,年内累涨25%。

微软启动跨洲数据中心超级集群项目,连接千里距离训练超大参数AI模型

微软启动跨洲数据中心超级集群项目,连接千里距离训练超大参数AI模型

微软认为下一代AI模型将使用数百万亿参数,为此开始连接远距离设施构建多数据中心集群。首个节点已于十月上线,连接威斯康星州和佐治亚州数据中心。这些名为"Fairwater"的新型设施采用芯片级液冷技术,几乎零耗水。通过连接数据中心,微软能够训练更大模型,并可选择土地便宜、气候凉爽、电力充足的地点建设。该网络最终将扩展至数十万个GPU,用于匹配不同工作负载需求。

上海人工智能实验室推出MUSE:会从经验中学习的AI智能助手

上海人工智能实验室推出MUSE:会从经验中学习的AI智能助手

上海人工智能实验室联合多家机构推出MUSE框架,首次实现AI助手的经验学习与自我进化能力。MUSE采用三层记忆架构,通过"计划-执行-反思-记忆"循环,让AI能够像人类一样从工作中积累经验。在TAC基准测试中,MUSE创造性地达到51.78%成功率,成为首个突破50%大关的系统,标志着AI助手从静态工具向智能伙伴的重要转变。

苹果联手人民大学推出BridgeDiT:让文字秒变逼真音画同步视频

苹果联手人民大学推出BridgeDiT:让文字秒变逼真音画同步视频

这项由人民大学与苹果公司合作的研究首次实现了基于文本的音画完美同步视频生成。研究团队通过创新的HVGC文本处理框架解决了模态干扰问题,并设计了双向交叉注意力机制实现视频与音频的实时协调。实验表明该技术在多项指标上达到业界领先水平,为影视制作、教育培训、内容创作等领域带来革命性应用前景。

ByteDance如何发现大语言模型的"功能令牌假说":那些被忽视的小词汇竟是AI记忆运作的关键

ByteDance如何发现大语言模型的"功能令牌假说":那些被忽视的小词汇竟是AI记忆运作的关键

字节跳动研究团队发现,大语言模型中看似不起眼的"功能令牌"(如逗号、"the"、"and"等高频小词)实际上是AI记忆系统的核心调度员。这些令牌能动态激活相关特征,指导AI进行准确预测,并在训练中驱动模型不断扩展知识库。该发现揭示了AI"思维"机制,为优化模型性能和提升可控性提供重要启示。

Anthropic宣布500亿美元数据中心建设计划

Anthropic宣布500亿美元数据中心建设计划

人工智能公司Anthropic周三宣布与英国云服务商Fluidstack签署合作协议,投资500亿美元在美国建设数据中心以满足不断增长的计算需求。数据中心将位于德克萨斯州和纽约州,预计2026年全面投入使用。CEO达里奥·阿莫代表示,这些设施将专为Anthropic定制,以最大化工作负载效率。尽管投资巨大,但相比Meta的6000亿美元和Stargate项目的5000亿美元计划仍显逊色。

CIO如何发现并解决AI隐性成本问题

CIO如何发现并解决AI隐性成本问题

CIO在快速拥抱AI技术时面临隐性成本威胁。AI支出不同于传统IT预算,需要实时监控令牌使用、API调用和基础设施成本。隐性成本主要存在于数据冗余、影子项目和未跟踪的模型使用中。数据重复和治理债务是主要成本消耗源。CIO需要与CFO合作建立跨职能可见性,将AI视为数据生态系统的一部分进行管理,确保从数据准备到模型部署的全生命周期成本可控。

Qumulo推出自主AI管理和GPU数据传输功能

Qumulo推出自主AI管理和GPU数据传输功能

Qumulo为其云数据平台推出三项AI相关新功能:Helios AI代理、CloudConnectAI加速器和AI网络。Helios通过系统级遥测数据实现自我管理、诊断和优化;CloudConnect AI加速器利用神经缓存技术将GPU数据加载时间缩短64%;AI网络提供专为AI工作负载优化的数据传输器,支持RDMA等协议,显著降低延迟。这些功能旨在构建自主化数据平台,为企业AI应用提供更智能的数据管理和传输解决方案。

红帽 Linux 获得离线管理、量子威胁缓解和新AI功能

红帽 Linux 获得离线管理、量子威胁缓解和新AI功能

红帽发布多项产品更新,涵盖Linux、OpenShift和人工智能产品组合,重点关注混合云性能、后量子安全和开发者生产力。包括企业级Linux 10.1和9.7版本正式发布,集成AI驱动的管理工具简化操作。新版本添加AI命令行助手,支持离线环境运行,简化AI加速器驱动安装,引入软重启功能减少维护停机时间,并增强量子抗性加密算法保护。

谷歌推出私有AI计算服务保护用户隐私数据

谷歌推出私有AI计算服务保护用户隐私数据

谷歌发布私密AI计算服务,旨在将Android设备端私密计算核心的信任承诺扩展到云端数据中心。该服务类似苹果的私有云计算,通过可信执行环境等技术对用户数据进行加密隔离处理。谷歌声称该系统在推理请求时在受保护环境中处理数据,会话结束后即丢弃,无管理员访问权限。不过安全专家指出,相关技术仍存在被攻破的可能性。

OpenAI发布更智能温暖的GPT-5.1版本

OpenAI发布更智能温暖的GPT-5.1版本

OpenAI正式推出GPT-5.1,主打更温暖自然的对话风格和增强的智能水平。新版本包含即时模式和思考模式两种变体,其中思考模式在简单任务上速度更快,复杂任务上更持久。GPT-5.1默认采用更对话化的语调,并提供友好、高效、专业等多种个性化选项。模型在遵循特定指令方面也有显著改进。该更新首先面向付费用户推出,随后扩展至免费用户。