在过去两年中,许多组织启动了数十个AI概念验证项目,但失败率很高且投资回报率令人失望。如今一种新趋势正在出现,标志着对AI实验散弹枪式做法的重大重新评估。
一些IT观察者现在看到许多组织正在减少启动的AI概念验证项目数量,一些IT领导者转向商业AI工具,而更多其他人则专注于有限数量的战略性和针对性用例。
IT和管理咨询公司AArete的AI、数字和技术解决方案董事总经理Bhrugu Pange表示,在经历了广泛实验的时代后,当时公司在探索AI的潜力,现在许多公司已经锁定了少数几个用例。
"我们看到从大量实验向更专注、结果导向的AI部署的明显转变,"他说。"组织不再并行启动数十个概念验证,而是优先考虑少数几个用例,在这些用例中AI可以深度嵌入到操作工作流程中并产生可衡量的结果。"
例如,Pange说,AArete一个客户的财务部门将发票处理确定为高摩擦工作流程,然后创建了一个AI驱动的解决方案,包括生成式AI、自然语言处理和光学字符识别。
"这项来自财务部门内部的工作在周期时间和准确性方面带来了可衡量的改进——超越了几个缺乏操作锚定的并行实验,"他补充道。"这种专注的方法反映了一个实际转变:当数据、业务背景和操作紧迫性在少数几个定义明确的跨企业计划中结合时,AI能提供最大价值。"
数十个AI概念验证的时代正在消逝
IDC在2024年4月的调查发现,组织当时平均运行37个AI概念验证项目,但一些AI专家认为这个数字被严重低估了,一些大公司运行数百个试点项目。
Pange说,许多在前几年运行数百个概念验证的组织现在已经减少到大约30个,独立的业务部门专注于3到5个实验。
其他观察者也看到了同样的趋势,尽管他们没有提供关于今天启动的概念验证项目数量下降的估计。该公司AI首席技术官Jason Hardy表示,即使在2024年7月数据管理提供商Hitachi Vantara发布最新的全球数据基础设施状况报告时,大多数组织已经开始像传统研发一样对待AI项目,并期望在两到三年的时间范围内获得回报,而不是快速投资回报率。
Hardy说,由于公司高管持续坚持要求进行AI实验,IT领导者被迫平衡速度和成本。尽管有压力,他最近与客户的几乎每次对话都包括关于运行更少、更具战略性的概念验证的讨论。
"虽然快速行动的压力导致许多早期采用者在完全准备好之前就部署AI,但我们开始看到成功的采用,特别是随着对代理AI关注的扩展,"他说。
Hardy说,现在更多IT领导者似乎在抵制由错失恐惧症造成的压力,AI实验的"狂野西部"似乎正在结束。
"虽然通过概念验证和试点识别可能结果的散弹枪方法确实撒了更大的网,但客户更容易被追逐科学实验或低价值结果所分心,"他说。"没有可执行的蓝图,客户可能发现自己试图用许多不同的方式解决同样的基础问题,强调了低效率。"
改变对话方向
IT外包提供商TaskUs的CIO Chandra Venkataramani表示,仍然被鼓励启动数十个AI概念验证的CIO应该将对话引导到其他地方。他的公司已经创建了AI采用的战略框架,重点是有限数量的高价值概念验证。
"不要把速度误认为是进步,"他说。"当有压力启动大量AI项目时,CIO应该将对话引导向影响。将您的决策锚定到明确的业务目标和员工结果上。"
他建议CIO采取长期的AI部署方法。AI项目应该符合操作需求,IT领导者应该专注于与团队和客户建立对已部署AI工具的信任。
Venkataramani补充说:"要有选择性。不要仅仅为了打勾而运行概念验证。"
快速失败的价值
然而,一些AI专家敦促CIO为AI实验留出空间。IDC生成式AI策略项目高级研究总监Nancy Gohring表示,虽然许多组织已经启动了副驾驶和其他"低垂果实"AI工具,但当IT领导者找到专业化和绿地AI用例时,可以推动竞争优势。
她补充说,CIO仍应专注于AI实验的"快速失败"方法,并在1000个潜在用例和少数几个之间找到平衡。
Gohring说:"与其担心从概念验证到生产的移动速度,不如建立让您能够非常快速地尝试新想法并确定它们是否值得推向生产的系统。您真的不是想要更少的概念验证。您想要能够快速实验。"
AI平台供应商Domino Data Lab的首席运营官Thomas Robinson补充说,过去的概念验证失败可能更多是缺乏治理的问题,而不是启动的概念验证数量的问题。他建议,IT领导者应该为AI项目建立里程碑,包括有效的项目管理和评估进度的检查点。
他补充说,概念验证仍然有价值。"放慢速度不一定更明智,"他说。"我们一直看到的是,在内置治理的情况下加速AI生命周期实际上会带来更好的结果。"
Robinson补充说,快速迭代与负责任的监督相结合是成功的关键。
"关键不是更少的概念验证,而是受管理的速度——能够快速实验、快速学习并扩展有效的东西,同时保持合规性和控制,"他说。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。