这篇研究介绍了"量化LLM评价者",一个创新框架,能使大型语言模型(LLM)在评估其他AI输出时更接近人类判断。由麻省理工和Adobe联合研发的这一方法,将评估过程分为两个阶段:先让LLM生成文本评价,再用轻量级机器学习模型将这些评价转化为更准确的数值评分。研究提出了四种评价者模型,适用于不同评估场景,实验表明它们不仅能显著提高评分准确性,还比传统微调方法更节省计算资源。这一框架特别适合人类反馈有限的场景,为AI评估领域开辟了高效且可解释的新路径。
这项研究揭示了机器生成文本检测器的重大漏洞。意大利研究团队通过直接偏好优化技术,成功训练AI模型生成更像人类的文本,导致顶尖检测器准确率下降高达60%。研究者分析了语言特征分布变化,发现经过训练的模型能有效模仿人类写作特征,而检测器主要依赖于浅层语言线索识别AI文本。这一发现为开发更可靠的检测方法提供了重要参考,同时也警示我们区分人类与AI内容将变得越来越困难。
这项研究介绍了一种新型多模态扩散模型,能够同时生成量子电路的离散结构和连续参数。由因斯布鲁克大学和NVIDIA公司研究人员开发,该模型利用两个独立但协同工作的扩散过程处理门类型选择和参数预测,克服了传统量子电路编译方法的效率瓶颈。研究证明了该模型在不同量子比特数量、电路深度和参数化门比例下的有效性,并通过快速电路生成创建了数据集,从中提取出有价值的结构见解,为量子电路合成提供了新方向。
TAE Technologies在最新一轮投资中获1.5亿美元,累计融资约18亿美元。公司利用 AI 技术优化融合反应堆设计,目标于 2030 年代商业化发电,谷歌等巨头均参与合作。
DeepMind 推出的 AI 系统 AlphaEvolve 利用自动评估机制解决数学与科学问题,在数学测试和 Google 数据中心优化中提升效率。虽非颠覆性革新,却能帮助专家腾出精力应对更重要任务。
谷歌宣布升级 Chrome 增强保护功能,桌面版现采用 Gemini Nano 本地大语言模型防御新型远程技术支持诈骗,Android 版也将加强 Chrome 通知诈骗防护。
Amazon 在仓库中测试了名为 “Stow” 和 “Pick” 的机器人,虽然效率接近人力,但因失误率及操作损伤问题,目前机器人系统尚未成熟到可完全替代人工。
微软认为 AI 能加速实用核聚变的研发,为解决 AI 高能耗问题提供可能,虽核聚变仍处于实验阶段,但借助 AI 助力探索清洁能源之路或缩短试错周期。
Stripe在年度大会上推出多款支付创新产品,包括基于亿级交易训练的AI模型提升反欺诈能力、稳定币多币卡以及多支付渠道管理工具,并快速协助 Nvidia 完成账单迁移,全面扩展全球支付方式。
卡巴斯基CEO在Gitex Asia 2025上指出,全球网络攻击数量激增,专业及国家级黑客组织愈发猖獗。他提出构建默认安全、各系统间严格隔离的“网络免疫”系统,以保障关键基础设施安全。
美国 DARPA 推出 expMath 项目,依托 AI 技术加速纯数学研究,旨在培养具备证明和抽象能力的 AI 数学家。
Hitachi Vantara 在 VSP One 存储平台上集成 CyberSense AI 检测工具,实现对数据变化的实时分析,保障性能、安全和节能,提升勒索软件防护与数据恢复能力。
人工智能正在深刻改变餐饮行业。从智能点餐系统到烹饪机器人,AI 技术正被广泛应用于食品制备、销售营销和客户服务等多个环节。这不仅提高了餐厅的运营效率,还为消费者带来了更加个性化和便捷的用餐体验。随着 AI 技术的不断发展,未来的餐饮业将迎来更多创新和变革。
TransUnion信用报告公司宣布其大规模数据湖项目即将完成,OneTru平台已为内部和客户带来显著收益。该平台支持新的信贷风险产品、身份营销解决方案和欺诈预防服务,提高了生产力并改善了客户体验。公司正专注于为客户提供分析、风险管理等服务,并计划推出可组合的灵活平台。
一项新研究表明,OpenAI 可能在未获授权的情况下,使用 O'Reilly 出版社的付费图书来训练其先进的 AI 模型。研究发现,与早期模型相比,OpenAI 的 GPT-4o 模型对 O'Reilly 付费内容表现出更强的识别能力。这一发现引发了对 AI 训练数据来源和版权问题的讨论,同时也凸显了 AI 公司在寻求高质量训练数据方面面临的挑战。
高通宣布收购越南AI开发商MovianAI,以加强其在生成式AI领域的实力。MovianAI隶属于VinAI,后者是越南最大企业集团之一Vingroup旗下的机器学习研究实验室。此次收购将为高通带来高素质人才,有助于其在多个行业提供先进的AI解决方案,包括智能手机、PC和软件定义汽车等领域。
本文探讨了人工智能发展路径的两种观点:一是传统的"人工智能-通用人工智能-超级人工智能"三阶段路径;二是直接从人工智能跨越到超级人工智能的新观点。文章分析了两种路径的利弊,指出虽然目前尚无定论,但考虑这两种可能性对人类应对AI发展至关重要。文章还探讨了人类是否能主导这一进程,以及AI可能带来的影响。
IBM迅速确立了其作为企业AI领域重要竞争者的地位。该公司采用全栈平台策略,结合专有模型、与Red Hat混合云基础设施的深度整合以及全球咨询规模优势,执行多管齐下的方法,已经在运营效率和财务收益方面取得显著成效。IBM的AI相关业务在不到两年时间内增长至50亿美元,其中约80%来自咨询业务,20%来自软件订阅。
Experian信用局采用了一种审慎的AI应用方法,开发了内部流程、框架和治理模型,帮助其测试和大规模部署生成式AI。这种方法融合了先进的机器学习、代理式AI架构和基层创新,改善了业务运营,并为约2600万美国人扩大了金融服务的可及性。Experian的AI之旅展示了传统数据公司如何转型为AI驱动的平台企业,为负责任的AI治理提供了蓝图。