高达80%的企业技术领导者将AI项目失败归因于缺乏可见性或监督,这是Solvd公司本周发布的一份报告中的发现。该数据来自这家AI咨询公司在12月对500名美国大型企业CIO和CTO进行的调查。
超过一半的公司表示,今年因性能不佳而关闭试点项目的可能性相当大。随着AI技术的采用展开,AI预算正面临严格审查,超过五分之四的CIO和CTO表示,他们的董事会正在质疑在AI上的支出金额。
Solvd首席执行官Mike Hulbert告诉CIO Dive,一些企业正在采取投资组合方法,同时试点多个AI实验,并假设其中一些会失败。
企业AI支出增长迅速,但缺乏支持项目的基础设施,如框架和治理,阻碍了技术达到预期或在2026年证明投资回报率。
Solvd发现,这些失败大多与项目缺乏可见性、实验协调不当和管理不善有关,而非技术本身的问题。为团队解决这些问题通常需要建立对项目的明确所有权和整个组织的透明度。
尽管71%的领导者报告他们计划在2026年适度增加对AI倡议的投资,但AI项目今年也将比过去受到更严格的审查。技术领导者报告说,他们面临更大压力,需要支持那些结果有数据支撑的AI项目。大多数领导者预计,只有能够回本的AI项目才能在2026年存活下来。
Hulbert说,许多公司仍处于AI实验的早期阶段,但该行业已经进入了比2022年炒作阶段反复失败更成熟的阶段。Hulbert警告说,形成成功试点可能需要多次尝试,因为CIO和CTO可能需要评估他们的方法是否过于狭窄或过于宽泛。
"虽然在某些情况下这很痛苦,但正确的方法是抛弃那些东西,利用团队已有的所有宝贵学习经验重新开始,但要采用更强大的架构和更广泛的用例范围,"Hulbert说。
重新开始对需要汇报项目进展的技术领导者来说可能感觉像是重击,但这比继续在没有成效的项目上花钱要好,52%的技术领导者报告他们的组织正在发生这种情况。
Hulbert说,这种方法与技术历史上的运作方式相反。
"一直以来都有这样的想法:我们建立基础,进行这些基本投资,然后随着时间的推移在此基础上构建,"他说。"但这不是我们对AI的追求。底层技术发展如此迅速,有时正确的答案就是抛弃它。"
Q&A
Q1:为什么80%的企业AI项目会失败?
A:根据Solvd的调查,大多数AI项目失败主要是由于缺乏项目可见性、实验协调不当和管理不善,而不是技术本身的问题。解决这些问题通常需要建立对项目的明确所有权和整个组织的透明度。
Q2:2026年企业AI投资会有什么变化?
A:虽然71%的领导者计划在2026年适度增加AI投资,但项目将面临更严格的审查。技术领导者需要更大压力支持有数据支撑的AI项目,预计只有能够回本的AI项目才能存活下来。
Q3:企业应该如何处理失败的AI试点项目?
A:专家建议采取投资组合方法,同时试点多个AI实验。对于失败的项目,有时正确的做法是抛弃原有项目,利用团队的学习经验重新开始,采用更强大的架构和更广泛的用例范围,而不是继续在无效项目上投入资金。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。