人工智能文章列表第20页-至顶网频道

OceanBase

人工智能

2025-11-18

数据库领跑者OceanBase公布五年成绩单：年均增速超100%，客户数破4000家

OceanBase凭“一体化+多云原生”领跑分布式数据库。

人工智能

自动驾驶

交通效率优化

2025-11-18

AI重塑交通运输：无人驾驶汽车只是冰山一角

随着AI技术不断发展，交通运输行业正迎来重大变革。MIT研究显示，AI将很快自动化价值650亿美元的交通工作，大幅提升运输效率。从陆地到海空，AI正在推动全方位的交通创新。斯坦福专家强调，AI将通过基础模型、合成数据和数字孪生等技术，实现从单一车辆自动化到整个交通网络优化的跨越式发展，同时解决可持续性、安全性和公平性等关键挑战。

人工智能

数学计算

基准测试

2025-11-18

研究显示大语言模型数学计算能力令人担忧

波兰研究团队开发ORCA数学基准测试，对五个主流大语言模型进行评估。结果显示ChatGPT-5、Gemini 2.5 Flash、Claude Sonnet 4.5、Grok 4和DeepSeek V3.2的准确率均低于63%。测试涵盖生物化学、工程建筑、金融经济等七个领域的500道数学题目。研究发现模型主要在四舍五入和计算错误方面存在问题，表明自然语言推理进步并未直接转化为可靠的计算能力。

人工智能

数据中心

电价上涨

2025-11-18

数据中心和加密货币挖矿将推高2026年电价

美国能源信息署预测，2026年批发电力价格将上涨8.5%至每兆瓦时51美元，主要由数据中心和加密货币挖矿需求驱动。尽管可再生能源发电比例将达到创纪录的26%，加上核电18%的贡献，无碳发电将占总量44%，但整体碳排放变化不大。AI数据中心的快速增长成为电力需求最大推动因素，谷歌宣布到2027年在德州增投400亿美元建设数据中心。

台湾AI工厂将采用VAST Data存储方案为7000颗Blackwell GPU提供数据支持

人工智能

数据存储

基础设施建设

2025-11-18

台湾AI工厂将采用VAST Data存储方案为7000颗Blackwell GPU提供数据支持

GMI Cloud在台湾投资5亿美元建设AI工厂数据中心，将使用VAST Data存储系统为7000个Blackwell GPU提供数据支持。该项目与英伟达合作，GPU将配备NVLink、InfiniBand和Spectrum-X以太网网络，部署在96个机架中，每秒可处理约200万个令牌，功耗16兆瓦。VAST的EB级数据基础设施支持模型训练、推理和实时数据处理。

人工智能

强化学习

语言模型

2025-11-18

Meta研究团队：让AI写作也能接受"奖惩教育"的新方法

Meta超级智能实验室联合麻省理工学院开发了SPG三明治策略梯度方法，专门解决扩散语言模型强化学习训练中的技术难题。该方法通过上下界策略为AI模型提供精确的奖惩反馈机制，在数学和逻辑推理任务上实现了显著性能提升，为AI写作助手的智能化发展提供了新的技术路径。

人工智能

机器人控制

多模态融合

2025-11-18

上海AI实验室推出Vlaser：让机器人像人一样思考和行动的突破性模型

上海AI实验室联合多所知名高校推出的Vlaser模型，成功将机器人的视觉理解、语言处理和精确行动能力统一在单一架构中。该模型基于600万个高质量训练样本构建，在12项综合测试中全面领先同类产品，实际机器人操作成功率超过64%，为机器人智能从工具向伙伴的转变奠定了重要基础。

人工智能

计算机视觉

数学教育

2025-11-18

港大团队推出数学AI新突破：让计算机"画图思考"解决数学难题

这项由港大、美团、港中大联合开展的研究提出了CodePlot-CoT系统，让AI通过生成绘图代码来进行数学视觉推理。该系统解决了现有AI无法有效处理需要画图辅助的数学题难题，在专门构建的Math-VR数据集上取得21%的性能提升，为AI数学推理开辟了新方向。

普林斯顿大学重磅发现：AI模型也需要"个性化教学"，STAT方法让数学能力飞跃提升

人工智能

个性化训练

数学推理

2025-11-18

普林斯顿大学重磅发现：AI模型也需要"个性化教学"，STAT方法让数学能力飞跃提升

普林斯顿大学研究团队开发了STAT方法，通过让AI"老师"分析"学生"模型的技能缺陷，针对性制定训练方案。该方法在数学能力测试中实现了7.5%的显著提升，并在未见过的竞赛中平均提升4.6%。这种个性化AI训练方法突破了传统"一刀切"训练的局限，证明AI模型也需要因材施教的精准指导。

数据库

人工智能

2025-11-18

OceanBase发布首款AI数据库seekdb，探索数据库AI范式的跃迁

三行代码构建AI应用，实现百亿级多模数据的混合搜索。

人工智能

网页自动化

多跳推理

2025-11-18

浙江大学团队打造会玩浏览器的AI助手：真正像人类一样上网搜索信息

这项由中科院、滑铁卢大学等多所院校联合完成的研究开发了BrowserAgent，一个能够像人类一样直接操作网页浏览器的AI助手。与传统需要转换工具的方法不同，它能直接点击、滚动、搜索网页，仅用5300个训练样本就在多跳推理任务上比最先进模型提升20%准确率。

亚马逊研究揭示AI记忆陷阱：当智能助手"记住"你的身份背景，竟然影响了它对情感的理解

人工智能

情感理解

算法偏见

2025-11-18

亚马逊研究揭示AI记忆陷阱：当智能助手"记住"你的身份背景，竟然影响了它对情感的理解

亚马逊研究团队通过测试15个AI模型发现，当AI助手记住用户背景信息时，会对相同情感情况产生不同理解，称为"个性化陷阱"。优势社会地位用户获得更准确的情感解释，而弱势群体接受质量较低的理解。这种系统性偏见可能在心理健康、教育等领域放大社会不平等，提醒我们需要在追求AI个性化的同时确保算法公平性。

人工智能

文档评估

视觉布局

2025-11-18

微软团队打造文档"美学评委"：AI如何判断文件的专业度？

微软等机构联合研发了DOCREWARD文档奖励模型，专门评估文档的结构布局和视觉风格专业度。该模型基于包含11.7万对文档的大规模数据集训练，在人类偏好准确性测试中超越GPT-5达19.4个百分点。研究解决了现有AI工作流忽视文档视觉呈现的问题，为智能文档生成和专业化排版提供了新的技术方案。

人工智能

3D人物生成

计算机视觉

2025-11-18

图宾根大学团队突破：让AI像魔法师一样创造无限个逼真3D人物

德国图宾根大学研究团队开发的InfiniHuman系统实现了3D人物生成的重大突破，能够通过文字描述、身体参数和服装图像精确控制生成过程。该系统包含11万个多样化身份的数据库，提供12秒快速生成和4分钟高质量制作两种模式，在游戏开发、影视制作、电商试衣等领域具有广阔应用前景，并承诺开源以推动行业发展。

人工智能

大型推理模型

动态环境适应性

2025-11-18

UC伯克利团队首次揭示：大型推理模型在紧急情况下会"恐慌"和"自我怀疑"

加州大学伯克利分校研究团队首次系统性地研究了大型推理模型在动态环境中的表现，发现这些AI在面对中断时会出现推理泄露、恐慌和自我怀疑等类似人类的情绪化反应，准确率最多下降60%。研究揭示了传统静态评估的局限性，并提出了包括提示引导和渐进式训练在内的多种改进方案，为AI技术从实验室走向实际应用指明了方向。

人工智能

强化学习

数据优化

2025-11-18

高质量训练数据越来越稀缺，卡内基梅隆大学研究者用小模型"回收"网络垃圾数据

卡内基梅隆大学研究团队提出REPRO方法，用4B参数小模型通过强化学习将网络低质量数据回收为高质量训练数据。该方法在22项任务上比基线提升4.7%-14.0%准确率，超越了70B参数的ReWire方法，将数据效率提升2-3倍，为解决大语言模型训练数据稀缺问题提供了新思路。

人工智能

自然语言处理

新型算法

2025-11-18

南京大学团队揭秘：仅用8亿数据就让AI既会翻译又会推理，打破传统认知

南京大学团队开发出Qwen3-XPlus模型，仅用8亿数据tokens就实现了翻译与推理能力的完美结合，打破了传统多语言AI模型"翻译强但推理弱"的局限。通过创新的分层选择性调优方法，该模型在低资源语言翻译上取得突破性进展，同时在数学推理等任务上保持优异表现，为AI领域提供了高效、实用的多语言增强新方案。

人工智能

视频编辑

评估基准

2025-11-18

当指令变成魔法棒：腾讯优图实验室等机构发布首个全面评估AI视频编辑的"智能评委"系统

腾讯优图实验室联合多所高校发布IVEBench，这是首个专门评估AI指令引导视频编辑能力的综合基准测试系统。该系统包含600个高质量测试视频，覆盖8大编辑类别35个子类别，建立了视频质量、指令遵循度和视频保真度三维评估体系。测试结果显示，现有AI视频编辑系统在复杂指令理解和执行方面仍有较大改进空间，为未来技术发展提供了明确方向。