Meta AI应用推出名为Vibes的新功能,专门展示AI生成的短视频内容。用户可以浏览他人创作的AI视频,也能从零开始制作或改编现有视频。创建的视频支持私信分享或转发至Instagram和Facebook。CEO扎克伯格表示这是新产品方向的早期探索,Meta超级智能实验室将与Midjourney等公司合作开展AI项目。
谷歌正式宣布将在2026年合并Chrome OS和Android操作系统,Android将成为主导系统。谷歌Android生态系统总裁萨马特表示,此举旨在加速AI技术在笔记本电脑上的应用,并实现笔记本与Android生态系统的无缝协作。通过迁移到Android代码库,谷歌可以在更多设备上部署Gemini AI服务。萨马特指出,Android在平板电脑上的成功证明了其在笔记本电脑上的可行性,同时Android还能为XR技术提供更广泛的平台支持。
蚂蚁集团研发的HANRAG系统通过智能调度模块"Revelator",能根据问题类型选择最优处理策略:直接回答、单步搜索、并行处理或逐步推理。系统具备强大噪音过滤能力,在单跳和多跳问答测试中全面超越现有方法,准确率提升6-20%,搜索效率显著改善,为智能问答系统发展开启新篇章。
Meta研究团队开发IGPO算法,创新性地解决了AI大模型学习复杂推理时的"零优势困境"。该算法利用扩散大语言模型的填空能力,在AI模型陷入困境时提供战略性提示引导探索。实验显示在数学推理任务中性能显著提升:GSM8K提升4.9%,Math500提升8.4%,AMC提升9.9%,同时将无效训练情况减少60%,为AI学习方法带来重要突破。
韩国UNIST团队开发出全球首个能同时理解视觉、听觉和文字信息的情感AI系统,不仅能听懂对话内容,还能感知用户的真实情绪状态并用合适的语调回应。该系统基于包含31000句真实对话的MSenC数据集训练,在情感适宜性、对话自然性等方面显著优于现有技术,为人机交互带来革命性改变。
OpenAI发布ChatGPT新功能Pulse,可在用户睡眠期间生成个性化报告,提供5-10条简报帮助用户快速了解当日重要信息。该功能旨在让用户像查看社交媒体一样优先使用ChatGPT。Pulse首先向每月200美元的Pro订阅用户开放,未来计划扩展至所有用户。功能支持连接Gmail、日历等应用,可解析邮件、生成日程安排。报告以卡片形式展示,包含AI生成的图像和文本,涵盖新闻摘要、个性化建议等内容。
AI平台公司Clarifai发布新推理引擎,声称能让AI模型运行速度提升一倍,成本降低40%。该系统采用多种优化技术,从CUDA内核到高级推测解码,能在相同硬件上获得更强推理性能。第三方测试显示其在吞吐量和延迟方面创下行业最佳记录。该产品专门针对推理过程优化,特别适用于需要多步骤响应的智能体和推理模型。
在伦敦Unscripted大会上,DevOps公司Harness展示了最新AI驱动模块,包括AI管道构建器、AI测试自动化、构建失败时的自主代码修复、AI应用安全和AI混沌测试等。该公司指出,软件团队仅有30-40%时间用于规划编码,其余时间消耗在测试、安全、部署和优化上。CEO表示,通过专用AI智能体分解任务并相互验证输出,结合组织上下文知识,可有效减少AI幻觉问题。
韩国芯片初创公司FuriosaAI推出NXT RNGD服务器,搭载该公司自研的AI推理神经处理芯片。该服务器在本地数据中心和私有云环境中相比GPU解决方案具有更高效率和更低成本。公司瞄准银行、金融、教育和电商等企业客户,希望通过开源和自研软件的组合提供一体化解决方案,挑战英伟达在AI推理市场的主导地位。
AI初创公司Liquid AI发布名为"Nanos"的突破性小型AI模型,参数规模在3.5亿到26亿之间,可在手机、笔记本和嵌入式设备上本地运行。该模型在专门任务上可达到GPT-4o级别性能,支持多语言翻译、数据提取、数学推理等功能。公司采用"液态神经网络"架构,使模型能以极小体积提供前沿级性能,实现设备端AI处理,确保隐私安全并降低成本。
Databricks和OpenAI宣布建立多年期1亿美元合作伙伴关系,将OpenAI最新模型(包括GPT-5)原生集成到Databricks数据智能平台,服务全球超2万家客户。该协议旨在简化企业AI代理部署,使企业能够在其治理数据之上直接构建生产就绪的AI应用。通过Agent Bricks开发环境的紧密集成,组织可在单一平台上开发、评估和扩展AI代理系统,无需复杂的数据迁移或独立工具管理,同时确保数据安全性和合规性要求。
Solidigm发布了PS1010系列E1.S规格液冷SSD,采用单面冷板技术实现双面散热,专为高密度AI工作负载设计。该产品支持热插拔,相比同类产品能耗降低33%,提供3.84TB和7.68TB容量选择,是目前最快的PCIe 5.0直连存储SSD之一。
谷歌DeepMind团队开发出名为RoboBallet的AI系统,能让制造业机器人自主规划作业流程。该系统通过图神经网络技术,同时解决任务分配、调度安排和运动规划三大难题,将复杂的机器人协调问题转化为图形数据处理。在测试中,RoboBallet能在几秒内为8台机器人规划出高效的作业轨迹,执行效果接近人工工程师水平但速度更快,有望大幅提升工厂自动化编程效率。
参赛项目包括《AI儿童陪伴系统》《机械零件工艺知识智能体》《端侧多模态医疗险理赔智能体》等多个具有实际应用价值的智能体解决方案。
这项由谷歌DeepMind研究团队完成的开创性研究首次系统阐述了AI智能体经济的概念框架。研究提出"沙盒经济"模型,从起源性质和边界渗透性两个维度分析AI智能体经济形态,预测未来将出现自然涌现且高度透水的AI经济网络。研究详细探讨了科学加速、机器人协调、个人助手等应用场景,提出基于拍卖机制的公平资源分配方案和使命经济概念,并深入分析了技术基础设施需求、社区货币应用以及相关风险防范措施。
中国人民大学研究团队提出LoFT方法,通过参数高效微调基础模型解决长尾半监督学习中的数据不平衡问题。该方法利用预训练模型的良好校准特性改进伪标签质量,并扩展出LoFT-OW版本处理开放世界场景。实验显示,仅使用传统方法1%的数据量就能取得更优性能,为AI公平性和实用性提供了新的解决方案。
剑桥大学等机构研究发现,AI模型在长期任务执行中存在致命缺陷:微小的单步改进会带来指数级的长期能力提升,但传统模型会被自己的历史错误"带偏",出现自我设限效应。思考型模型如GPT-5能执行超过1000步任务,打破了这一限制。研究重新定义了AI价值评估标准,认为长期执行能力比单次交互表现更重要。
香港科技大学等研究机构联合提出InfGen,一种革命性的AI图像生成方法。该技术将内容生成与分辨率调整分离,通过固定尺寸的潜在表示配合专门的生成器,实现任意分辨率图像的快速生成。相比传统方法需要100秒生成4K图像,InfGen将时间缩短至10秒内,速度提升10倍以上。该方法具备即插即用特性,可直接升级现有扩散模型,为高分辨率图像生成提供了全新解决方案。
史丹福大学团队开发出名为QuantAgent的AI股票预测系统,由四个专业AI助手协作:技术指标分析师、图形识别专家、趋势分析师和风险管理师。该系统仅通过分析股价数据就能预测市场走向,在比特币、标普500等八种资产的测试中,预测准确率普遍超过随机水平,最高达到80%。该研究展示了人工智能在高频交易领域的突破性应用。
中科大研究团队针对新兴MCP协议环境开发了首个专业AI评估基准MCP-AgentBench,包含33个服务器188种工具和600道测试题目。研究发现开源模型表现优异,通义千问达到64.7%最高得分超越专有模型,揭示了交互框架对性能的关键影响,为AI工具使用能力评估建立了新标准。