根据商业与技术洞察公司Gartner的最新预测,到 2028 年,中国 70% 的大型企业将为大语言模型在 AI 基础设施上的部署建立完善的治理框架,而2025 年这一比例不足10% 。
Gartner分析师们将在5月26-27日于上海举行的Gartner2026大中华区高管交流大会上进一步深入探讨塑造AI基础设施未来的主要技术趋势。
Gartner研究副总裁周玲表示:“中国目前正在快速推进生成式 AI 能力,包括大语言模型、软件、生态集成与硬件革新等。2025 年 Gartner CIO 和技术高管调研显示, 2025 年中国企业计划增加生成式AI 和 AI 领域的技术投资,平均增幅分别为 40.3% 和 33.3% (见图 1),将进一步推动相关技术的发展和使用。”

然而,要成功实现大语言模型在 AI 基础设施中的生产部署并非易事,需统筹协调技术、运维与治理策略,确保模型达成性能指标的同时,保障数据安全与合规性。因此,Gartner提出三大关键要素,以帮助企业确保大语言模型在生产环境中安全有效运行的基础。
构建全面的部署战略
为推动大语言模型在AI基础设施上的高效部署,需制定一套全面稳健的战略布局,涵盖AI基础设施环境适配、场景化架构设计、技术优化实施,并严格遵循监管合规要求。
Gartner研究副总裁周玲表示:“在大语言模型于AI基础设施部署过程中,企业需制定与整体AI战略高度契合的部署方案。这包括识别高价值AI应用场景,权衡通用基础模型与行业专属模型的适用性,并联合业务与AI团队,明确商用方案、基础设施容量、数据管道及高度定制化部署的操作指引。”
制定稳健的部署治理流程
为了成功将大语言模型部署到 AI 基础设施的生产环境中,中国的 I&O 部门必须建立一套稳健的治理流程,采取切实可行的步骤促进资源管理、持续监控以及敏捷更新。
Gartner研究副总裁周玲表示:“构建稳健的大语言模型部署与治理流程至关重要。这应涵盖部署环境与架构的科学选择、优化硬件与容器化技术的应用,以及基础设施的监控与可观测性管理,从而全面提升I&O团队在AI基础设施上部署大语言模型的能力。”
促进关键利益相关方之间的紧密协作
部署大语言模型是一项高度复杂的工作,要求业务、法务、安全及AI与数据团队密切协作。以往各自为政的部门,如今需从项目启动之初就通力合作,确保技术开发充分兼顾法律与安全需求。为此,建立涵盖法务、安全、数据工程与数据科学、产品管理、软件开发及高管层代表的跨职能AI治理委员会,成为保障大语言模型合规、高效落地的关键举措。
Gartner研究副总裁周玲表示:“治理委员会需要促成早期对话,使各方在风险评估、合规要求和运营标准方面达成一致。同时还需定期组织跨部门会议,并确保信息沟通充分且决策透明;此外培训计划和文档工作也发挥着至关重要的作用。”
好文章,需要你的鼓励
这期是技术加情怀了。极少数人基于热情和对卓越的执念,构建了数十亿人每天依赖但普通人从不知晓的基础设施。
这篇来自上海交通大学的研究构建了名为AcademiClaw的AI测试基准,收录了80道由本科生从真实学业困境中提炼出的复杂任务,覆盖25个以上专业领域,涵盖奥数证明、GPU强化学习、全栈调试等高难度场景。测试对六款主流前沿AI模型进行评估,最优模型通过率仅55%,揭示了AI在学术级任务上的明显能力边界,以及token消耗与输出质量之间近乎为零的相关性。
Antigravity A1无人机推出"大春季更新",新增AI智能剪辑、语音助手、延时摄影模式及升级版全向避障系统。用户可通过语音命令控制Sky Genie、深度追踪等核心功能,虚拟驾驶舱支持第三人称视角飞行。随着产品进入墨西哥市场,Antigravity全球覆盖已近60个国家,持续推动无人机向更智能、更易用方向发展。
Meta AI安全团队于2026年5月发布了代码世界模型(CWM)的预发布安全评估报告(arXiv:2605.00932v1)。该报告对这款320亿参数的开源编程AI在网络安全、化学与生物危险知识及行为诚实性三个维度进行了系统性测试,并与Qwen3-Coder、Llama 4 Maverick和gpt-oss-120b三款主流开源模型横向比较,最终认定CWM的风险等级为"中等",不超出现有开源AI生态的风险基线,可安全发布。