近年来,关于AI项目高失败率的讨论已有不少。在一个日益敏捷的时代,CIO及其团队自然希望践行"快速失败、快速学习"的理念——换言之,迅速行动,边试边学。然而,太多组织在尚未打好基础的情况下就仓促推进AI。
在启动任何AI项目之前,CIO需要像经验丰富的登山者一样:与业务团队建立稳固的"大本营",就核心业务问题和机会达成共识,并让组织为接下来的攀登做好准备。
原因很简单:从AI中实现价值(与任何重大举措一样)需要的是纪律,而不仅仅是速度。这种纪律体现在:制定与明确业务成果挂钩的清晰战略,并从一开始就定义成功标准、治理机制与合规要求。在此基础上,优先级排序至关重要。AI应用场景永远多于可用资源,因此CIO必须聚焦于最有可能带来可衡量业务影响的项目——尤其是在软件定价日益与成本节约和劳动力替代比例挂钩的背景下。
同样重要的是,CIO需要避免陷入"无休止试点"的陷阱,确保所选AI项目具备可信的规模化路径,否则试点项目只会不断堆积,却与实际业务脱节。
一旦这些基础工作就位,组织就可以开展经过审慎评估的试点,不仅用于测试技术,还可以重新思考业务能力与流程,乃至像未来学家琳达·叶茨所建议的那样,"释放内部的独角兽潜能"。
从试点到落地,差距究竟在哪里?
让我们深入分析项目成功的结构要素,以及项目高失败率背后的根本原因。
在德雷斯纳咨询服务公司的研究中,我发现了三个关键特质,能够区分已从试点阶段走向规模化落地的项目。这些特质并非锦上添花,而是决定项目能否实现规模化的核心要素。
基于这一背景,我希望听听一位长期为企业提供AI落地支持的顶级顾问的看法。安永AI与数据业务负责人瓦姆西·杜武里认为,"AI项目失败,往往是因为速度超越了结构"。他援引了安永最新发布的《技术脉搏调查》中的发现——该调查访问了500位在科技行业工作的美国商界领袖:大量AI应用正在未经IT审核或批准的情况下运行。
这一现象令人担忧,让人想起多年前CIO们极力避免的"影子IT"问题——那些未经审查、未被整合、缺乏保护的系统。而今的区别在于,AI将这些风险直接嵌入工作流程,并以更快的速度蔓延。
更糟糕的是,杜武里指出,问题不仅仅在于项目优先级和选择上,在实践中,项目往往因治理薄弱、职责不清、数据质量差以及大量孤立试点而陷入停滞。"结果不是雄心的失败,而是价值的停滞,"他说,"例如,一家公司启动了多个AI试点项目,希望帮助分析师提高工作效率,但分析师仍然需要手动核对数据、处理复杂信息和噪音,并在多个试点项目之间拼凑决策。价值昙花一现,最终趋于平台期。"
这恰好与本文开头提到的三个成功特质形成了完美呼应。
更多试点,为何没有创造更多价值?
德雷斯纳的数据显示,15%的组织已将智能体AI投入生产,34%的组织已将某种形式的生成式AI解决方案投入生产。我们预计,这34%的总量是具备三项成功标准的组织——即商业智能成熟度、AI与机器学习技能,以及强有力的数据领导力。
与此同时,34%的组织正在试验智能体AI,53%的组织表示正在试验生成式AI。这两组数字之间的差距令人意外,但这也意味着,IT组织可以在不解决底层数据与治理问题、不审慎考虑业务优先级的情况下,推出一个战术性的生成式AI解决方案。
由此,一个问题依然存在:组织如何为能够产生战略性、可衡量的生产价值的试点项目创造空间?
显然,负责任的AI必须被设计进运营流程中。佩德罗·阿莫里姆教授建议,CIO应以风险投资的方式管理项目组合:资助大量小规模、有时间限制的赌注,快速学习,并在有清晰产业化路径的赢家上加倍投入。
他还补充道,与此同时,组织需要"尽早建立基本的防护栏(数据分类、隐私与知识产权规则、敏感决策的人工审核环节、评估基准以及明确的禁止条件),并确保在漏斗前端留有预算,以免被迫押注于一两个大赌注"。
因此,明智的试验需要兼顾强大的数据完整性、嵌入式网络安全,以及对偏差和模型漂移等问题的持续监控。
信任是AI可持续发展的基础。透明度、治理机制、培训以及清晰的人工监督,都是确保员工理解AI工作方式和人工判断何时仍不可或缺的关键。
"明智的试验意味着决定复杂性应由谁来承担。CIO的职责是确保智能体吸收可变性与编排工作,而人类保留判断力和关键决策权,"杜武里说。
在实践中,这要求开展更少、更有纪律性的试验——以真实工作流程为锚点,而非孤立的任务。这一点至关重要,因为组织确实需要快速行动,但缺乏管控的速度只会放大崩溃风险。为此,杜武里强调,"问题在于管控,而非动力"。
他表示,与其试点AI来"辅助"客服代表,CIO不如主导一项试验——让智能体端到端处理分类、解决方案和路由转接,仅在出现例外情况、政策判断或需要客户同理心时才上报给人工。
成功的试点不仅要证明准确性,还要证明可运营性。"明智的试验需要以AI原生方式交付软件,"他说。
从第一天起就将风险纳入考量
德雷斯纳的研究显示,CIO和数据领导者当前最为担忧的主要风险包括以下几类:数据隐私泄露、合规违规、AI产出的不准确性以及对关键系统的过度依赖。
那么,明智的组织如何从一开始就预见、评估并降低AI风险?
成功的组织拥有一位能够跨部门凝聚力量、共同构建必要防护栏的CIO。必须记住,降低风险并不意味着减慢创新,而是关乎对齐与共同目标。
为此,杜武里表示,"风险必须在第一天就被设计进来。因为AI加速了行动,不受管控的使用会造成安全敞口。"他援引安永数据指出,45%的科技领导者报告了与未经授权的生成式AI使用相关的已确认或疑似敏感数据泄露事件,39%报告了知识产权泄露。
这不是工具问题——这是设计上的失败。
CIO需要标准化经过审批的平台,将管控机制直接嵌入工作流程,并明确界定智能体在哪些情况下可以自主行动、哪些情况下必须由人工介入,他说。做好了,治理将成为规模化的助推器,而非创新的刹车。
杜武里建议CIO建立经批准的AI工具清单、针对数据与知识产权风险的实时监控机制,并赋予团队明确权力叫停不合规的部署。
"团队会行动更快,因为安全行为被内嵌进系统,而非事后强制执行。随着智能变得越来越便宜、越来越普及,企业不会自动变得更简单。赢家会刻意将复杂性从人转移到机器,同时将判断力、信任与问责权牢牢掌握在人手中,"他说。
以纪律驱动敏捷:先打好基础
CIO应将敏捷原则应用于AI——但不能缺乏纪律。组织需要一个与明确业务成果挂钩的清晰战略,并从一开始就定义成功标准、治理机制和合规要求。数据成熟度与明确的防护栏不可或缺,这一基础能够支撑更明智的试验,同时从一开始就将风险纳入考量。成熟度更高的组织已经抢占先机,因为他们早已应对了这些挑战。对于处于较低成熟度环境中的CIO来说,优先事项清晰明确:投资于流程和数据能力以取得早期成果——然后不断精进、规模化,并将数据和业务流程产业化。
Q&A
Q1:为什么那么多AI项目卡在试点阶段,无法真正落地?
A:根据安永的调查,AI项目停滞的主要原因包括:治理机制薄弱、职责不清、数据质量差,以及大量孤立的试点项目缺乏整合。分析师仍需手动在多个试点系统间协调数据和决策,导致价值短暂出现后迅速进入平台期。解决这一问题的关键在于将项目锚定于真实工作流程,建立清晰的规模化路径,而非一味追求试点数量。
Q2:CIO在推进AI项目时,应该如何平衡速度与风险管控?
A:安永AI负责人杜武里指出,"问题在于管控,而非动力"。CIO应标准化经过审批的AI平台,将管控机制直接嵌入工作流程,并明确智能体与人工介入的边界。治理不是创新的刹车,而是规模化的助推器。安全行为一旦内嵌进系统,团队反而能行动更快。
Q3:组织应具备哪些基础条件,才能让AI项目从试点走向规模化生产?
A:德雷斯纳咨询的研究发现,能够实现规模化落地的项目通常具备三个关键特质:商业智能成熟度、AI与机器学习技能,以及强有力的数据领导力。此外,还需要从一开始就明确业务目标、成功标准和合规要求,并建立数据分类、隐私保护、人工审核节点等基本防护栏。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。