在急于拥抱AI技术的过程中,首席信息官们遇到了一个意想不到的障碍:隐性成本威胁着企业创新和业务转型的进程。
AI支出行为与传统IT预算截然不同,提供AI驱动执行助手的Fyxer AI公司首席信息官Andy Wallace表示:"成本每小时都在波动,CIO需要通过实时仪表板监控Token使用量、API调用次数和基础设施成本。"
网络恢复公司Commvault首席信息官Ha Hoang认为,揭示隐性成本的第一步是创建可见性,不仅仅是支出可见性,还包括使用情况和价值的可见性。她指出,隐藏的AI成本往往存在于数据蔓延、影子项目和未跟踪的模型使用中。"CIO需要的可观测性应该超越基础设施,包括数据如何被访问、复制和治理。"Hoang认为,CIO应该将用于数据保护和恢复的纪律性同样应用于AI。"这包括明确的血缘关系、生命周期管理,以及对每个数据集和模型的问责制。"
成本消耗源头
Hoang将数据重复和治理债务确定为主要的成本消耗源。"随着AI实验加速进行,数据副本在云环境、沙盒和模型中大量增殖,"她说。这种不必要的支出不仅推高了存储和计算成本,还增加了合规性和安全风险。"如果底层数据没有得到严格管理,今天看起来几分钱的推理成本可能在日后变成重大的技术和运营债务,"Hoang警告道。
Wallace认为最大的隐性成本是效率低下。"对我们Fyxer来说,这可能意味着优化不佳的提示、未监控的模型漂移或不必要的计算周期。"然而他指出,同样的效率陷阱也适用于实施其公司软件的企业CIO。Wallace表示,控制效率低下的明智方法是让企业的首席财务官参与到这个过程中。"财务部门需要像工程部门一样理解这个挑战,因为跨职能的流畅协作是避免账单到来时出现恶性惊喜的关键。"
追求极简主义
将AI视为数据生态系统的一部分,而不是例外,这很重要,Hoang说。"从一开始就将成本可见性和治理构建到AI生命周期中,从数据准备到模型部署,"她建议道。
同时,自动化数据分类、保留和保护策略也有助于防止代价高昂的蔓延。Hoang还建议测试AI的可恢复性和弹性,就像企业对待其核心应用程序一样。"这确保企业能够长期维持其AI投资,"她说。
将AI视为一个活跃的财务系统,而不是固定的技术投资,Wallace建议。这意味着为IT和财务部门使用联合仪表板,设置明确的支出阈值,并在使用模式发生变化时设置自动警报。"当财务和工程团队共享可见性时,你就能将过去每月的震惊转变为可管理、可预测的过程,"他说。
CIO还需要与CFO和财务团队密切合作,并排比较指标,因为财务监督必须与工程保持同样的步伐,Wallace说。"等待月底对账的日子已经结束了;如果你不是每30分钟监控一次使用情况,你就已经落后了。"
谷歌初创企业领域首席技术官David White建议,尽可能寻求效率。"你是否仅仅因为认为最新技术会是最好的就使用它?"他问道。"你是否在使用最具成本效益的加速器,还是可以使用更便宜的GPU?"
隐藏成本
White认为CIO需要意识到隐藏的支出,比如那些保持一切运行、集成和调优的幕后团队成员所产生的成本。他指出,这包括调优模型所需的数据准备工作,即使你没有构建自己的模型。"所有让一切看起来完美的幕后角色都有成本——它们并不免费,"White说。
另一个重大错误是假设AI的行为方式与SaaS部署相同——实际上完全不同。"你支付的不是静态许可证费用——你支付的是随着团队使用方式扩展的持续计算费用。"
成本每天都在波动,有时甚至每小时都在变化,这取决于使用情况,Wallace警告说。"试图在没有CFO参与的情况下管理这种变化性,正是预算螺旋上升的原因,"他说。"财务部门需要对AI运营的实时可见性,而不是月度摘要。"
结语思考
组织的AI只会与它所依赖的数据基础一样可持续,Hoang说。"投资于可信、受治理且可恢复数据的CIO将更高效地释放AI价值,并避免因速度而失控带来的隐性成本。"
Q&A
Q1:为什么AI支出与传统IT预算不同?
A:AI支出每小时都在波动,不像传统IT预算那样相对固定。CIO需要通过实时仪表板监控Token使用量、API调用次数和基础设施成本,而不能等到月底对账。成本会根据使用情况每天甚至每小时变化。
Q2:AI项目的主要隐性成本有哪些?
A:主要包括数据重复和治理债务、优化不佳的提示、未监控的模型漂移、不必要的计算周期,以及幕后团队成员的人力成本。数据副本在云环境中大量增殖会推高存储和计算成本,还增加合规和安全风险。
Q3:CIO应该如何控制AI的隐性成本?
A:首先要创建成本、使用情况和价值的可见性,让CFO参与到过程中。建立IT和财务部门的联合仪表板,设置支出阈值和自动警报。将AI视为数据生态系统的一部分进行治理,自动化数据分类和保护策略。
好文章,需要你的鼓励
IBM在量子开发者大会上发布两款新型量子处理器。Quantum Nighthawk配备120个量子比特和218个新一代可调耦合器,比前代产品增加20%耦合器,可执行复杂度提升30%的电路。Quantum Loon是实验性处理器,展示了实现极低错误率和高效错误恢复的所有组件。IBM计划2026年底确认首批量子优势案例,并于2029年交付大规模容错量子计算平台。
腾讯研究团队提出GCPO算法,通过引入"黄金答案"解决小型语言模型推理能力不足问题。当传统对比学习失效时,该方法为模型提供正确示例指导,在多个数学推理基准上取得25%-54%的性能提升,为小型模型突破能力边界提供了新思路。
VDURA数据平台第12版本通过扩展元数据计算、添加系统级快照功能和支持叠瓦磁记录硬盘来降低每TB成本。新版本引入弹性元数据引擎,可动态扩展元数据节点,将元数据操作性能提升最多20倍。快照功能支持即时的节省空间的数据集时点副本。SMR硬盘支持通过智能写入放置引擎,在不影响吞吐量的情况下每机架增加25-30%容量。
上海人工智能实验室联合多家机构推出MUSE框架,首次实现AI助手的经验学习与自我进化能力。MUSE采用三层记忆架构,通过"计划-执行-反思-记忆"循环,让AI能够像人类一样从工作中积累经验。在TAC基准测试中,MUSE创造性地达到51.78%成功率,成为首个突破50%大关的系统,标志着AI助手从静态工具向智能伙伴的重要转变。