Gartner:聚焦四大领域,避免公有云产生高成本错误
2024年,中国的公有云支出增长了21.8%,预计到2028年这一领域的支出将增加至1120亿美元。随着中国企业越来越多地采用公有云解决方案来推动创新和敏捷性,他们也遇到了许多挑战。这些挑战可能导致代价高昂的错误,引发业务部内的投诉和问题升级。
2024年,中国的公有云支出增长了21.8%,预计到2028年这一领域的支出将增加至1120亿美元。随着中国企业越来越多地采用公有云解决方案来推动创新和敏捷性,他们也遇到了许多挑战。这些挑战可能导致代价高昂的错误,引发业务部内的投诉和问题升级。
计划采用云技术的企业往往希望学习早期采用者的经验,避免潜在的陷阱和不必要的成本。企业公有云采用过程中应避免出现错误的四个常见领域(见图1):

由于云支出受到多种因素的影响,首席信息官(CIO)及其基础设施和运营(I&O)团队应与其他IT领导者(包括数据和分析、软件工程、安全、人工智能[AI]等领域的领导者)合作,避免在云采用过程中的高成本错误。
制定有效的工作负载配置策略
CIO及I&O领导者应制定有效的跨本地、公有云和混合多云环境的工作负载配置策略,以指导工作负载迁移到云端之前的应用评估和成本管理。
- 制定混合基础设施环境下的最佳工作负载配置策略:I&O领导者应制定工作负载配置策略,确保提供明确的指导,实现价值最大化,并提供敏捷性来适应未来变化。
- 为防止成本超支,多云采用时应考虑多方面因素: I&O领导者应该优先考虑首选提供商提出的工作负载配置策略,同时建立基于规则和策略驱动的决策流程,选择合适的应用环境。
- 评估应用组合并选择需要进行迁移的云应用:将应用迁移到云可以提供各种益处,但不能解决所有问题。具体益处因应用而异,这也是决定迁移与否的关键因素。Gartner应用评估框架从业务影响和云就绪度两个角度评估应用,有助于确定云迁移候选对象并进行优先级排序。
- 衡量企业应在云、数据中心还是边缘部署生成式人工智能(GenAI):如果可扩展性/性能要求是已知的,或通过一段时间运行观察出所需使用的基础设施资源量,则可以评估计算、存储和网络的准确总拥有成本,确定在云、数据中心或边缘上部署GenAI模型训练和推理的最经济方案。
设计最优架构解决方案
云采用中会产生高成本的一个领域是企业云解决方案的架构设计,以及云架构师是否意识到设计选择所带来的云成本影响。最佳架构应该在业务价值与成本效益之间取得平衡。CIO及I&O领导者需考虑以下方面的问题。
- 应在何时将微服务架构用于云原生应用:微服务架构(MSA)需要持续投资相关的人员与技术,以实现软件功能的持续交付与更新,确保企业可从中获得益处。当业务利益相关者能够了解到快速、可靠、灵活地交付和更新功能所带来的价值,并且这一价值超过了开发和运行复杂架构的投入时,投资微服务架构就具备了合理性。
- 使用无服务器计算来降低云成本:无服务器计算促进了单体应用系统的架构转型,在特定使用场景下有助于云计算服务的持续优化,同时降低了基础设施和运营成本。
- 考虑混合云环境下的云数据管理架构:在混合云模式下,成本考量取决于数据在不同环境之间的移动和集成方式。由于数据体量和移动方向的不同,会对系统性能和财务成本产生影响。
- 云安全架构设计:考虑使用能够改进云安全并实现成本效益的云原生工具和整合安全平台。云原生应用保护平台整合了零散的安全测试和防护工具,降低了IT的成本和技术复杂性。
建立云成本治理机制
主动云成本治理对于有效管理支出和控制预算限额至关重要;设计良好的治理机制不能仅仅依靠单个团队。CIO及I&O领导者需要考虑以下问题,以建立有效的云成本的治理机制。
- 不要依靠专门的财务运营(FinOps)团队来负责云成本治理:云成本治理不应仅仅依赖专门的财务运营团队,而应让多个职能部内都参与进来,并将技能融入到不同的角色中。
- 负责建立云成本的治理机制需要跨团队合作:稳健的治理机制是成功实施云财务管理(CFM)的关键基础。
- 实施云数据和分析(D&A)财务治理应遵循最佳实践:建立针对云的财务治理,使业务成果与最佳数据和分析定价模型保持一致。这一举措可解决一系列问题,如财务目标平衡、定价模式比较、去中心化控制管理。
实施有效的成本管理
云成本管理除了进行成本优化之外,CIO及I&O领导者还应考虑如下几方面的问题。
- 启动云成本管理:配置的每一项云资源都会对业务运营成本产生直接财务影响。云端运营以动态化的资源消耗为主,而数据中心成本管理方面的控制和现有流程不够健全,难以满足这一运营模式的需求。
- 从云成本角度管理云服务提供商:云卓越中心团队应与采购团队合作管理云服务提供商,重点关注财务管理而非仅仅削减成本。
- 使用财务运营工具来管理和优化云成本:为应对不断发展的云财务管理活动,工具和服务市场在过去几年中也显著扩大。做出明智采购决策的关键是在工具选择过程中使用一系列正确的输入标准。
管混合云成本:标记或标签是区分私有云和公有云中共作负载的基础,而制定明确的标签策略对于确保一致性至关重要。标签策略实施之后,企业可利用标签实现成本治理、访问控制、自动化和DevOps。
0赞好文章,需要你的鼓励
推荐文章
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。