人工智能 关键字列表
Meta计划2026年发布新一代图像视频AI模型

Meta计划2026年发布新一代图像视频AI模型

Meta正在其超级智能实验室开发代号为"Mango"的图像视频模型和代号为"Avocado"的文本模型,计划于2026年上半年发布。实验室负责人王亚历山大表示,新文本模型将增强编码能力,并探索能理解视觉信息、推理和规划的世界模型。Meta在AI竞赛中落后于OpenAI等竞争对手,其AI部门经历重组和人员流失,首席AI科学家杨立昆也已离职创业。

Kodiak AI利用自动驾驶技术和物联网连接变革货运行业

Kodiak AI利用自动驾驶技术和物联网连接变革货运行业

人工智能自动驾驶技术提供商Kodiak AI与Verizon Business合作,为其无人驾驶卡车服务引入连接性和物联网数据能力。Kodiak开发的虚拟驾驶系统结合先进AI软件和模块化硬件,利用Verizon的5G和LTE网络、物联网远程信息处理及ThingSpace管理平台,实现远程车队管理、空中软件更新和辅助自动驾驶功能。该合作为Kodiak提供高带宽、低延迟连接,支持其全天候无人驾驶运营,助力公司安全扩展业务并服务长途货运和工业客户。

Oracle和OpenAI数据中心项目获密歇根州监管机构批准

Oracle和OpenAI数据中心项目获密歇根州监管机构批准

密歇根州监管机构一致批准了DTE能源公司为甲骨文和OpenAI计划建设的大型数据中心供电的请求。该项目投资数十亿美元,装机容量达1.4吉瓦,位于塞林镇。监管机构认为公用事业公司与科技公司的合同保护了电网和普通用户利益,要求科技公司提供前期抵押。但听证会上部分公众对该项目表示反对,担心污染和电力供应问题。该项目是OpenAI星门计划的一部分,预计未来三年在美投资超4500亿美元。

数智时代,openGauss Summit 2025即将发布哪些技术创新破局

openGauss数据库作为中国领先的数据库根技术社区,始终将创新焦点锚定在数据库最核心、最底层的根技术上,确保每一次演进都精准回应产业发展的现实与未来需求。

“算力+储能”深度融合:超智算发布分布式算力超级节点储能解决方案

“算力+储能”深度融合:超智算发布分布式算力超级节点储能解决方案

超智算科技聚焦人工智能技术创新与生态建设,已在北京、上海、深圳、西安、云南昆明、广西崇左等全国核心城市部署多个大型算力中心节点,未来规划投入运营算力规模超50000P。

OpenAI发布GPT-5.2-Codex模型,软件工程自动化能力大幅提升

OpenAI发布GPT-5.2-Codex模型,软件工程自动化能力大幅提升

OpenAI发布新版GPT-5.2-Codex AI编程模型,专注自动化复杂软件工程任务。该模型在SWE-Bench Pro基准测试中准确率达56.4%,在代码重构、Windows环境性能和网络安全方面表现出色。新增的上下文压缩功能支持长期多步骤编程任务,增强的视觉能力可解读截图和技术图表。模型还具备AI辅助漏洞检测和修复功能,现已向付费ChatGPT用户开放。

Allen AI团队推出SAGE:首个能像人类一样"想看多长就看多长"的智能视频分析系统

Allen AI团队推出SAGE:首个能像人类一样"想看多长就看多长"的智能视频分析系统

Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。

北京大学团队突破音视频生成评测难题:首个综合评估基准VABench让AI视频"说话"更自然

北京大学团队突破音视频生成评测难题:首个综合评估基准VABench让AI视频"说话"更自然

北京大学等机构联合发布的VABench是首个专门针对AI音视频同步生成的综合评估基准。该研究通过15个维度全面测试了包括Veo3、Sora2在内的多个先进模型,发现端到端训练模型在音画协调方面表现更佳,但所有模型在人类声音处理和立体声生成方面仍需提升。

华中科技大学团队发现:任何语言模型都能"改造"成图文对话高手

华中科技大学团队发现:任何语言模型都能"改造"成图文对话高手

华中科技大学团队发现了一种将任意语言模型直接转换为视觉语言模型的新方法DiffusionVL,通过简单的"扩散微调"技术实现了性能和速度的双重提升。该方法仅需传统方法5%的训练数据,就在多个基准测试中取得30-40%的性能提升和2倍的推理加速,为构建高效多模态AI系统提供了全新路径。

腾讯AI团队突破:让AI学会自我指导,解决智能推理的根本难题

腾讯AI团队突破:让AI学会自我指导,解决智能推理的根本难题

腾讯AI实验室提出G?RL方法,让AI模型通过观察自身梯度特征来指导探索学习,而非依赖外部随机性或语义判断。该方法在数学推理等任务中显著提升性能,将相互对立的学习方向增加5倍,证明了内在驱动的自主探索比传统外部指导更有效,为AI训练开辟了新范式。

MBZUAI科学家发明AI版"火眼金睛":告别"真假孙悟空"的时代困扰

MBZUAI科学家发明AI版"火眼金睛":告别"真假孙悟空"的时代困扰

阿联酋人工智能大学研究团队开发出创新的图像真实性验证系统,通过"重合成测试"原理评估数字内容可信度。该方法不寻找虚假痕迹,而是验证真实图像的"身份证",在面对传统检测器完全失效的对抗攻击时仍保持可靠性能。研究发现随着AI技术进步,能被确认为真实的网络图像正在急剧减少,揭示了数字时代真实性验证的新挑战。

Ubiquant团队推出通用推理模型URM:让AI像人类一样循环思考

Ubiquant团队推出通用推理模型URM:让AI像人类一样循环思考

Ubiquant团队开发的通用推理模型URM通过模拟人类循环思考过程,在复杂推理任务中取得突破性进展。该模型在ARC-AGI测试中达到53.8%的正确率,远超现有方法。研究发现循环计算和强非线性能力是推理成功的关键,而非复杂架构设计。URM引入短卷积模块和截断反向传播技术,显著提升了推理性能,为AI推理能力发展指明新方向。

清华大学开创性突破:让AI能像福尔摩斯一样"破解"假视频的秘密

清华大学开创性突破:让AI能像福尔摩斯一样"破解"假视频的秘密

清华大学研究团队开发出名为Skyra的AI视频检测系统,能以91%的准确率识别AI生成的假视频,并像侦探一样详细解释发现的破绽。该系统突破了传统检测方法只能给出简单判断的局限,为解决虚假视频泛滥这一全球性挑战提供了可解释、高精度的技术方案,有望集成到未来的数字内容平台中。

小米HyperVL:让手机也能拥有"火眼金睛"的AI大模型

小米HyperVL:让手机也能拥有"火眼金睛"的AI大模型

小米HyperAI团队开发了专为移动设备优化的多模态AI大模型HyperVL,通过图像切块策略和双一致性学习技术,在1.8亿参数规模下实现了与大型模型相当的性能。该模型在处理速度上比传统方案快13倍,内存占用减少7倍,能够处理数学解题、图表分析、文档理解等多种实用任务,为AI技术在手机等移动设备上的普及应用开辟了新路径。

清华大学团队发明"先写草稿再验证"新技术,让AI回答速度提升5倍还能保证质量不下降

清华大学团队发明"先写草稿再验证"新技术,让AI回答速度提升5倍还能保证质量不下降

清华大学团队开发的DEER技术通过创新性地使用扩散模型作为草稿生成器,解决了大语言模型推理速度慢的关键问题。该技术采用"先写草稿再验证"的策略,能将AI回答速度提升2-5倍且保证质量不变。在代码生成任务中最高实现5.54倍加速,草稿接受长度达32个词,远超现有方法。DEER还展现出"可靠块再生成"等新兴能力,为AI系统架构设计提供了全新思路。

三星电子人工智能中心新研究:让AI也能玩拼图游戏,竟然比人类标注更准确

三星电子人工智能中心新研究:让AI也能玩拼图游戏,竟然比人类标注更准确

三星电子AI中心联合多伦多大学提出的"拼图课程强化学习"方法,让AI通过解决拼图游戏学习视觉推理能力,完全无需人工标注。该方法采用三种拼图游戏训练AI,结合难度感知课程和推理一致性监控,在多个视觉推理任务上显著超越现有方法。研究还意外发现现有评测基准存在大量标注错误,并提供了自动化清理方案,为AI训练范式转变提供重要启示。

伯克利团队推出FrontierCS:让AI像人类专家一样解决开放式编程难题

伯克利团队推出FrontierCS:让AI像人类专家一样解决开放式编程难题

加州大学伯克利分校等多所高校联合推出FrontierCS,这是首个专门评估AI在开放式编程问题上能力的测试平台。该平台包含156个没有标准答案的编程挑战,涵盖算法优化和真实研究场景。测试结果显示,即使是最先进的AI模型(如GPT-5、Claude等)在面对需要创造性思维的复杂问题时,表现仍远逊于人类专家。该研究为AI发展指明了新方向。

AI编程初创公司Lovable融资3.3亿美元,英伟达等科技巨头支持

AI编程初创公司Lovable融资3.3亿美元,英伟达等科技巨头支持

AI建站及应用开发工具开发商Lovable Labs宣布完成3.3亿美元B轮融资,由谷歌CapitalG和Menlo Ventures联合领投,英伟达、Salesforce、HubSpot等科技巨头跟投。公司估值达66亿美元,年度经常性收入已超2亿美元。该平台可通过聊天界面生成网站和应用代码,提供代码编辑、界面设计、托管基础设施等功能。融资将用于增强协作治理能力,拓展企业级市场。

英国政府机构发布报告:AI安全防护措施正在改善

英国政府机构发布报告:AI安全防护措施正在改善

英国政府人工智能安全研究所发布前沿AI趋势报告,基于两年的网络安全及科学研究。报告显示,AI模型安全防护显著提升,破解安全规则所需时间从数分钟延长至数小时。AI在网络安全学徒级任务的成功率从两年前不足10%提升至50%,首次有AI完成专家级网络任务。报告旨在为技术决策者提供基于证据而非猜测的清晰数据,支持AI负责任发展,同时确保安全可信。

2026年智能体AI:应用参差不齐而非全面普及

2026年智能体AI:应用参差不齐而非全面普及

智能体AI正引发热议,但实际应用情况复杂。麦肯锡调查显示,39%的企业正在试验智能体,仅23%在业务部门扩展应用。尽管Salesforce等厂商已将智能体嵌入应用,但跨平台多智能体系统部署缓慢。技术挑战、厂商生态壁垒、数据安全风险及可靠性问题制约了智能体普及。IDC预测,2026年全球2000强企业中40%的岗位将涉及智能体协作。专家建议IT领导者应开展试点测试,建立治理监控机制,在扩展前确保可控性和可见性。