人工智能 关键字列表
Meta研究团队发布超大规模视觉推理数据配方:让AI像人类一样"看图解题"的秘密

Meta研究团队发布超大规模视觉推理数据配方:让AI像人类一样"看图解题"的秘密

Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。

北京交通大学团队突破:让AI学会自己管理记忆,小模型也能干大事

北京交通大学团队突破:让AI学会自己管理记忆,小模型也能干大事

这项由北京交通大学等机构联合完成的研究首次将记忆管理作为AI的内在学习能力,而非外部工具。MemAct框架让AI主动编辑工作记忆,配合新开发的DCPO训练算法解决了记忆编辑带来的技术挑战。实验证明,较小的MemAct模型能以更少资源超越大型传统模型,不同规模模型还会自然演化出适应性策略,为AI效率提升开辟了新路径。

阿里巴巴团队突破:让AI直接在像素世界"画图",告别中间商赚差价

阿里巴巴团队突破:让AI直接在像素世界"画图",告别中间商赚差价

这项由阿里巴巴AMAP团队联合英伟达和加州理工完成的研究,成功实现了AI直接在像素空间生成高质量图像,无需依赖VAE编码器这个"中间商"。通过创新的两阶段训练框架,EPG模型在ImageNet-256上达到2.04的FID分数,仅需75次函数评估,性能媲美主流VAE方法但效率更高。研究还首次成功训练出像素空间一致性模型,实现8.82 FID的单步生成效果,为AI图像生成技术开辟了新的发展道路。

当AI学会"避开套路":Adobe研究院如何让机器生成真正有创意的图片

当AI学会"避开套路":Adobe研究院如何让机器生成真正有创意的图片

Adobe研究院联合以色列理工学院和特拉维夫大学提出了VLM引导的自适应负向提示方法,通过在AI图像生成过程中实时识别并排除常见模式,成功解决了现有AI模型只能生成典型化内容的问题。该方法让AI在约束中探索真正的创意空间,生成的创意宠物中87%属于未知类别,同时保持了物体的功能有效性,为AI创意生成开辟了新路径。

Meta发布第三代SAM视觉AI模型,助力野生动物保护研究

Meta发布第三代SAM视觉AI模型,助力野生动物保护研究

Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。

OpenAI推出免费ChatGPT教师版,提供GPT-5.1无限使用至2027年

OpenAI推出免费ChatGPT教师版,提供GPT-5.1无限使用至2027年

OpenAI发布了ChatGPT教师版,专门面向K-12学校教职员工,免费使用至2027年6月。该版本包含GPT-5.1 Auto无限消息功能,支持文件上传、图像生成等特性,同时符合《家庭教育权利法》要求。教师可用其创建教学材料,分享聊天记录,并获得其他教师使用建议。此前OpenAI已推出面向学生的ChatGPT Edu和学习模式功能。

驯服数据混乱:为企业构建AI就绪的数据平台

驯服数据混乱:为企业构建AI就绪的数据平台

企业AI已达到关键转折点,但大多数项目在产生价值前就停滞了。数据科学家需要使用7-15个工具来处理数据,仍需数月才能获得可用状态。IDC研究显示,不到44%的AI试点项目能投入生产。问题不在于算力或模型架构,而是无法在碎片化异构环境中实现数据管道的运营化。Hammerspace AI数据平台通过统一数据命名空间和自动化数据编排,解决了企业数据孤岛问题,为AI工作负载提供高性能统一数据平面。

欧盟拟放松AI和隐私法律监管政策

欧盟拟放松AI和隐私法律监管政策

欧盟委员会提出全面修改科技监管政策的提案,旨在减少大型科技公司面临的监管障碍。修改内容包括:允许AI公司访问共享个人数据进行模型训练、简化小企业审批流程、将AI监管集中至AI办公室、推迟高风险AI应用的严格规定实施。此外,备受诟病的Cookie横幅将被重新设计,减少弹出频率并支持一键同意。该提案现已提交欧洲议会审批,可能面临质疑声音。

亚马逊与伊利诺伊大学联手研究:让AI助手学会遵守复杂规则的新方法

亚马逊与伊利诺伊大学联手研究:让AI助手学会遵守复杂规则的新方法

这项由伊利诺伊大学厄巴纳-香槟分校与亚马逊联合开展的研究,提出了一种名为"多模态策略内化"的创新技术,让AI助手能够将复杂的工作规则"牢记在心"而无需每次查阅。通过三阶段训练方法,AI助手的准确率提高了70.7%,处理效率提升了85.7%,同时保持了良好的通用智能水平。该技术为构建更智能、更高效的AI工作伙伴奠定了重要基础。

加州大学圣地亚哥分校团队发布Falconer框架:让大语言模型与轻量代理联手,以90%成本削减实现规模化知识挖掘

加州大学圣地亚哥分校团队发布Falconer框架:让大语言模型与轻量代理联手,以90%成本削减实现规模化知识挖掘

加州大学圣地亚哥分校团队提出的Falconer框架创新性地解决了大语言模型在知识挖掘中成本高昂的问题。该框架让大语言模型担任规划师和标注师,训练轻量级代理模型执行具体任务,将复杂的知识挖掘统一为获取标签和获取文本段两个原子操作。实验表明,Falconer在保持与先进大语言模型相当性能的同时,推理成本降低90%,处理速度提升20倍以上,为大规模知识挖掘提供了高效实用的解决方案。

OPPO AI实验室推出AndesVL:让大模型在手机上也能看懂图片聊天

OPPO AI实验室推出AndesVL:让大模型在手机上也能看懂图片聊天

OPPO AI中心的AndesVL研究团队开发了一系列能在手机上流畅运行的多模态AI模型,参数规模从0.6B到4B,分为专注日常对话的指令版和擅长深度推理的思考版。通过创新的1+N LoRA架构、量化感知训练和多项移动端优化技术,在联发科天玑9500芯片上实现了6.7倍解码加速和30.9%内存减少,在32个基准测试中展现出一流性能,为移动端AI应用提供了完整解决方案。

英特尔明年上线的18A制程平台,能否成为“AI原生”拐点?

英特尔明年上线的18A制程平台,能否成为“AI原生”拐点?

“Intel 18A正在将我们的产业带入一个全新的时代,‘埃米’时代。”

大语言模型改写社媒与广告:AI时代的创作革命

大语言模型改写社媒与广告:AI时代的创作革命

人工智能为已经过度充斥内容的社交媒体世界增添更多燃料。AI的大规模生产能力让内容泛滥问题更加严重,同时算法操控也变得更加可疑。在广告领域,AI工具可能彻底改变传统广告模式,通过智能代理的受托责任替代常见广告形式。未来AI甚至可能使用人类的AI化身代笔写书,模仿其声音、历史和个性。这引发了关于人类作者身份和写作本质的深刻思考。

英特尔明年上线的18A制程平台,能否成为“AI原生”拐点?

英特尔明年上线的18A制程平台,能否成为“AI原生”拐点?

“Intel 18A正在将我们的产业带入一个全新的时代,‘埃米’时代。”

SAP客户偏离升级路径:英国零售巨头的选择引发行业思考

SAP客户偏离升级路径:英国零售巨头的选择引发行业思考

欧洲零售巨头金士佛决定放弃SAP推荐的S/4HANA升级路径,转而将ECC系统迁移至谷歌云并采用第三方支持。面对2027年SAP停止ECC支持的截止期限,全球仅39%的ECC客户已购买S/4HANA许可证。金士佛通过谷歌云和第三方服务实现了AI创新,质疑了SAP"创新胡萝卜"策略的必要性。但这一决定可能导致失去未来与SAP谈判的商业优势。

Taho挑战Kubernetes推出AI专用高性能计算框架

Taho挑战Kubernetes推出AI专用高性能计算框架

分布式计算初创公司Taho完成350万美元种子轮融资,目标是替代Kubernetes成为人工智能工作负载的主要编排和调度层。该公司由来自Meta、谷歌和Snap的基础设施资深人员创建,声称其计算框架可将工作负载处理时间提升最多100%,同时大幅降低成本。Taho开发了高性能联邦计算框架,通过替换复杂的基础设施软件来提高AI硬件效率。

DeepMind推出AlphaProof:AI数学证明系统获奥赛银牌

DeepMind推出AlphaProof:AI数学证明系统获奥赛银牌

谷歌DeepMind团队开发的AI系统AlphaProof在2024年国际数学奥林匹克竞赛中获得银牌水平表现。该系统结合神经网络、搜索算法和测试时强化学习,能够理解数学结构并进行形式化证明。团队使用Lean编程语言训练AI翻译和验证数学陈述,创建了8000万个形式化数学问题的数据库。虽然计算成本高昂且需要几天时间解决问题,但这标志着AI在高级数学推理方面的重大突破。

数据中心能耗需求将在2030年飙升,AI增长加速推动

数据中心能耗需求将在2030年飙升,AI增长加速推动

Gartner预测,人工智能需求激增正推动全球数据中心市场增长,对全球电力供需模式产生双重影响。数据中心电力需求今年将增长16%,到2030年将翻倍。预计2025年全球数据中心电力消耗将达448太瓦时,2030年升至980太瓦时。AI优化服务器今年将占数据中心总功耗的21%,2030年将升至44%。美国和中国将占全球数据中心电力需求的三分之二以上。

英伟达股价或将下跌,Vertiv、超微电脑和CoreWeave可能随之下滑

英伟达股价或将下跌,Vertiv、超微电脑和CoreWeave可能随之下滑

英伟达将于周三发布第三季度财报,市场预期营收和调整后每股收益分别增长56%和59%。由于软银孙正义等知名投资者减持,英伟达股价较10月29日峰值下跌15%。基于相关性分析,Vertiv、超微电脑和CoreWeave等公司股价与英伟达高度关联。分析师预测三种情景:若业绩超预期,英伟达股价可涨至200美元;若符合预期但毛利率下降,股价或跌4-8%;若业绩不及预期,股价可能暴跌12-18%。

微软将Windows打造为"智能体操作系统"

微软将Windows打造为"智能体操作系统"

微软正在将Windows 11改造为"智能代理操作系统",在任务栏中集成AI代理功能。新功能允许AI代理在后台执行任务,用户可通过任务栏图标查看进度状态。微软还在文件资源管理器中集成Copilot,提供文档摘要、文件问答等功能。此外,Click to Do功能得到改进,可将网页表格转换为Excel文档。这些AI功能采用本地AI和云端AI混合模式,为用户提供更智能的操作体验。