人工智能 关键字列表
仅需250个恶意文档就能让大语言模型产生后门漏洞

仅需250个恶意文档就能让大语言模型产生后门漏洞

研究人员发现,大型语言模型如ChatGPT、Gemini和Claude仅需250个恶意文档就能被植入后门漏洞。研究测试了6亿到130亿参数的模型,发现无论模型规模如何,植入后门所需的恶意样本数量基本恒定,而非按比例增长。攻击者可通过在训练数据中插入特定触发短语的文档,操控模型输出。虽然现有安全训练可在很大程度上修复这些后门,但研究强调需要更强的防御策略来应对这一威胁。

CIO们利用AI助力IT采购决策,超八成决策者已开始使用

CIO们利用AI助力IT采购决策,超八成决策者已开始使用

研究显示,超过81%的IT决策者正在采用AI技术辅助IT采购过程。AI主要应用于供应商评估审查、解决方案推荐、RFP自动化创建以及采购后性能ROI测量等环节。多家企业案例表明,AI能够显著缩短供应商评估时间,从数周压缩至数天,同时帮助识别兼容性问题和合同异常条款。企业普遍采用"信任但验证"的方式,将AI输出作为决策输入而非最终答案,确保人工最终审核。

RLDP:卢森堡大学让隐私保护AI训练的颠覆性突破——一种自学习的"智能管家"让数据安全与模型效果完美共存

RLDP:卢森堡大学让隐私保护AI训练的颠覆性突破——一种自学习的"智能管家"让数据安全与模型效果完美共存

卢森堡大学研究团队开发的RLDP框架首次将强化学习应用于差分隐私优化,创造性地解决了AI训练中隐私保护与模型效果的矛盾。该方法如同智能教练,能动态调整隐私保护策略,在四种语言模型上实现平均5.6%的性能提升和71%的训练时间缩短,同时增强了抗隐私攻击能力,为敏感数据的AI应用开辟了新路径。

腾讯混元团队发布MixGRPO:让AI图像生成训练效率提升71%的混合式加速方案

腾讯混元团队发布MixGRPO:让AI图像生成训练效率提升71%的混合式加速方案

腾讯混元团队联合北京大学提出MixGRPO技术,通过混合ODE-SDE采样策略和滑动窗口机制,将AI图像生成训练效率提升50%-71%,同时在多项人类偏好评估指标上超越现有方法。该技术采用"从难到易"的渐进优化策略,专注于图像生成早期阶段的重点优化,并引入高阶求解器进一步加速训练过程,为AI图像生成的产业化应用提供了更高效可行的解决方案。

AI拥抱并扩展企业软件市场,资金持续涌入

AI拥抱并扩展企业软件市场,资金持续涌入

人工智能正以超出预期的速度改变软件世界。本周OpenAI发布ChatGPT应用,谷歌推出Gemini Enterprise平台,亚马逊发布Quick Suite,都旨在通过AI代理改造9000亿美元的企业软件市场。尽管存在泡沫担忧,AI资金仍持续涌入,Reflection AI获20亿美元融资,n8n获1.2亿美元投资。同时硬件需求激增,OpenAI采购100亿美元AMD硬件,马斯克xAI为第二个数据中心采购180亿美元英伟达芯片,可能引发长达十年的定价危机。

Spotify已可连接ChatGPT:互动功能体验升级

Spotify已可连接ChatGPT:互动功能体验升级

OpenAI本周推出开发者应用集成功能,允许用户直接通过ChatGPT与第三方应用交互。Spotify成为首批合作伙伴之一,用户可要求ChatGPT创建播放列表、推荐歌曲等。连接账户后,AI可访问用户喜好和听歌历史,提供个性化建议。该功能支持145个国家的所有ChatGPT用户使用,但需注意数据隐私风险。

Apple 收购计算机视觉初创公司 Prompt AI

Apple 收购计算机视觉初创公司 Prompt AI

据报道,苹果收购Prompt AI的交易基本确定,该初创公司领导层已召开全体会议讨论协议细节。Prompt的核心产品Seemour将AI技术应用于安防摄像头,可识别特定人员、宠物和物体,发送异常活动警报并提供文字描述。这种收购人才和技术而非整个公司的策略已成为科技巨头在AI领域的常见做法,部分为了避免监管审查。

Windows Copilot现可创建Office文档并连接Gmail

Windows Copilot现可创建Office文档并连接Gmail

微软Windows Copilot功能获得重大更新,现在支持直接创建Office文档,包括Word、Excel和PowerPoint文件。此外,新版本还增加了Gmail连接功能,用户可以通过Copilot智能助手管理和处理邮件。这些新功能进一步增强了Windows系统的办公效率和跨平台协作能力。

上海AI实验室最新研究:让电脑真正"看懂"3D模型好坏的智能评判系统

上海AI实验室最新研究:让电脑真正"看懂"3D模型好坏的智能评判系统

这项研究开发了Hi3DEval系统,这是首个能够从整体、局部和材质三个层面全面评估3D模型质量的智能系统。通过创新的视频分析和3D几何特征结合方法,系统在各项评估指标上都显著超越了传统方法,为3D内容创作提供了标准化的质量检测工具,在游戏开发、虚拟现实、电商展示等领域具有广阔的应用前景。

格拉斯哥大学等顶尖高校联合提出AI智能体自进化三定律:打造永续学习的人工智能系统

格拉斯哥大学等顶尖高校联合提出AI智能体自进化三定律:打造永续学习的人工智能系统

这项由格拉斯哥大学等顶尖高校联合开展的突破性研究,首次系统性提出了"自进化AI智能体"概念框架,将AI发展划分为四个阶段并提出三定律指导原则。研究详细阐述了从单智能体到多智能体系统的优化方法,涵盖思维能力、记忆管理、工具使用等多个维度,并分析了生物医学、编程、金融法律等专业领域的定制化应用,为构建能够持续学习和自我改进的下一代AI系统提供了理论基础和实践指导。

Mirage颠覆视频制作:Captions公司让AI一句话变身专业导演

Mirage颠覆视频制作:Captions公司让AI一句话变身专业导演

Mirage是由Captions公司开发的革命性AI视频制作平台,用户只需用文字描述创意想法,系统就能自动生成专业水准的短视频内容。该技术基于专门训练的AI模型,深度理解社交媒体视频的节奏和吸引力法则。目前拥有超过10万日活用户和2000万注册用户,每月产生300万个视频。平台提供个人版Captions应用和企业版Mirage Studio,后者支持大规模内容制作和快速A/B测试,正在重新定义数字内容创作的门槛和效率。

复旦大学团队革命性突破:用代码教AI推理,让机器学会"举一反三"的思考艺术

复旦大学团队革命性突破:用代码教AI推理,让机器学会"举一反三"的思考艺术

这项由复旦大学等机构合作完成的研究提出了CodeI/O方法,通过让AI学习预测代码的输入输出来提升通用推理能力。该方法将45万个代码文件转化为350万个训练样本,让AI用自然语言推理代码逻辑,从而掌握逻辑规划、状态搜索等推理技能。实验显示,在14个评测基准上,CodeI/O训练的模型在符号、科学、逻辑、数学等推理任务上都实现了均衡显著的性能提升。

把1568个字符塞进一个向量再完美复原:AIRI实验室发现AI记忆力的惊人极限

把1568个字符塞进一个向量再完美复原:AIRI实验室发现AI记忆力的惊人极限

这项由俄罗斯AIRI实验室主导的突破性研究发现,AI模型的单个记忆向量能够完美压缩和复原多达1568个文本片段,压缩比达到1500倍。研究测试了14个不同模型,揭示了AI系统巨大的未开发记忆潜力,但当前利用率仅30%。这一发现不仅挑战了对AI记忆机制的传统认知,更为未来更高效的AI系统设计开辟了新方向,有望让AI助手拥有更强的长期记忆和信息处理能力。

清华联手阿里巴巴团队重磅发布S?-Guidance:让AI画图和做视频告别模糊失真,轻松生成电影级画面

清华联手阿里巴巴团队重磅发布S?-Guidance:让AI画图和做视频告别模糊失真,轻松生成电影级画面

清华大学与阿里巴巴合作开发的S?-Guidance技术,通过创新的"随机自引导"方法解决了AI图像和视频生成中的质量问题。该技术无需额外训练,仅通过随机屏蔽模型部分功能来创建内部"顾问",指导AI避免低质量输出。实验显示在多个评估维度上显著超越传统方法,人类专家评价中获得31%偏好率,计算开销仅增加20%。

斯坦福大学等顶尖机构联合发布:大语言模型架构的"减速新方案",谁说速度总是胜利?

斯坦福大学等顶尖机构联合发布:大语言模型架构的"减速新方案",谁说速度总是胜利?

这项由上海人工智能实验室等多家国际机构联合完成的研究系统性地梳理了大语言模型高效架构的最新进展。论文将创新方法分为七大类:线性序列建模、稀疏序列建模、高效全注意力、稀疏专家混合、混合架构、扩散语言模型和跨模态应用。研究揭示了如何在保持AI能力的同时大幅降低计算成本,为AI技术的可持续发展和广泛应用提供了重要指导。

大型语言模型能力测试大揭秘:中科院团队发布283个评测基准全景分析

大型语言模型能力测试大揭秘:中科院团队发布283个评测基准全景分析

中科院深圳先进技术研究院团队首次全面梳理了大型语言模型评测领域,分析了283个代表性基准,将其归纳为通用能力、领域专业和特定目标三大类别。研究揭示了现有评测体系面临的数据污染、文化偏见和静态评测等关键挑战,为构建更科学公正的AI评测框架提供了重要指导,推动人工智能技术向更安全可靠的方向发展。

思科发布升级版数据中心路由系统和AI芯片

思科发布升级版数据中心路由系统和AI芯片

思科推出8223路由系统和Silicon One P200芯片,用于满足企业日益增长的AI工作负载需求。该系统提供51.2 Tbps以太网固定路由器,P200芯片实现超过3艾比特每秒的互连带宽规模。新设备采用深缓冲设计,相比前代产品节能65%,支持跨数据中心AI集群分布式部署,解决物理空间和电力容量限制问题。

智能体AI测试需要大量应用才能验证效果

智能体AI测试需要大量应用才能验证效果

智能AI代理正成为软件开发的新宠,企业高管希望通过AI代理提升效率。尽管开发者对AI生成代码的质量存在担忧,但其潜在价值巨大。调查显示三分之二企业正在或计划使用多个AI代理进行软件测试,72%认为到2027年智能AI可实现自主测试。专业化的精简测试代理比大型模型更适合特定任务,需要建立负责任的信任框架来管理AI代理行为,但人工测试仍不可替代。

雀巢将AI打造为关键要素

雀巢将AI打造为关键要素

全球食品饮料行业正经历重大变革,AI系统在配方开发、减少浪费、可持续发展和供应链预测等领域发挥重要作用。雀巢在多个业务领域使用生成式AI,通过AI技术精准预测需求模式、动态调整生产和库存水平,并在产品配方开发中运用机器学习模型。同时,雀巢探索AI在碳追踪、制造业视觉系统等方面的应用以支持环保目标。

IBM推出自研Spyre加速器并携手Anthropic布局AI市场

IBM推出自研Spyre加速器并携手Anthropic布局AI市场

IBM在techExchange2025开发者大会上宣布与Anthropic建立合作伙伴关系,将Claude模型集成到Watsonx平台。同时发布自研Spyre AI加速器,将于10月28日开始向System z大机出货,12月12日支持Power系统。Spyre支持实时迁移推理工作负载,8卡配置可提供1TB内存和超过2.4千万亿次运算性能。IBM还推出基于多种AI模型的Project Bob集成开发环境,内部测试显示开发效率提升45%。