Gartner:聚焦四大领域,避免公有云产生高成本错误
2024年,中国的公有云支出增长了21.8%,预计到2028年这一领域的支出将增加至1120亿美元。随着中国企业越来越多地采用公有云解决方案来推动创新和敏捷性,他们也遇到了许多挑战。这些挑战可能导致代价高昂的错误,引发业务部内的投诉和问题升级。
2024年,中国的公有云支出增长了21.8%,预计到2028年这一领域的支出将增加至1120亿美元。随着中国企业越来越多地采用公有云解决方案来推动创新和敏捷性,他们也遇到了许多挑战。这些挑战可能导致代价高昂的错误,引发业务部内的投诉和问题升级。
计划采用云技术的企业往往希望学习早期采用者的经验,避免潜在的陷阱和不必要的成本。企业公有云采用过程中应避免出现错误的四个常见领域(见图1):

由于云支出受到多种因素的影响,首席信息官(CIO)及其基础设施和运营(I&O)团队应与其他IT领导者(包括数据和分析、软件工程、安全、人工智能[AI]等领域的领导者)合作,避免在云采用过程中的高成本错误。
制定有效的工作负载配置策略
CIO及I&O领导者应制定有效的跨本地、公有云和混合多云环境的工作负载配置策略,以指导工作负载迁移到云端之前的应用评估和成本管理。
- 制定混合基础设施环境下的最佳工作负载配置策略:I&O领导者应制定工作负载配置策略,确保提供明确的指导,实现价值最大化,并提供敏捷性来适应未来变化。
- 为防止成本超支,多云采用时应考虑多方面因素: I&O领导者应该优先考虑首选提供商提出的工作负载配置策略,同时建立基于规则和策略驱动的决策流程,选择合适的应用环境。
- 评估应用组合并选择需要进行迁移的云应用:将应用迁移到云可以提供各种益处,但不能解决所有问题。具体益处因应用而异,这也是决定迁移与否的关键因素。Gartner应用评估框架从业务影响和云就绪度两个角度评估应用,有助于确定云迁移候选对象并进行优先级排序。
- 衡量企业应在云、数据中心还是边缘部署生成式人工智能(GenAI):如果可扩展性/性能要求是已知的,或通过一段时间运行观察出所需使用的基础设施资源量,则可以评估计算、存储和网络的准确总拥有成本,确定在云、数据中心或边缘上部署GenAI模型训练和推理的最经济方案。
设计最优架构解决方案
云采用中会产生高成本的一个领域是企业云解决方案的架构设计,以及云架构师是否意识到设计选择所带来的云成本影响。最佳架构应该在业务价值与成本效益之间取得平衡。CIO及I&O领导者需考虑以下方面的问题。
- 应在何时将微服务架构用于云原生应用:微服务架构(MSA)需要持续投资相关的人员与技术,以实现软件功能的持续交付与更新,确保企业可从中获得益处。当业务利益相关者能够了解到快速、可靠、灵活地交付和更新功能所带来的价值,并且这一价值超过了开发和运行复杂架构的投入时,投资微服务架构就具备了合理性。
- 使用无服务器计算来降低云成本:无服务器计算促进了单体应用系统的架构转型,在特定使用场景下有助于云计算服务的持续优化,同时降低了基础设施和运营成本。
- 考虑混合云环境下的云数据管理架构:在混合云模式下,成本考量取决于数据在不同环境之间的移动和集成方式。由于数据体量和移动方向的不同,会对系统性能和财务成本产生影响。
- 云安全架构设计:考虑使用能够改进云安全并实现成本效益的云原生工具和整合安全平台。云原生应用保护平台整合了零散的安全测试和防护工具,降低了IT的成本和技术复杂性。
建立云成本治理机制
主动云成本治理对于有效管理支出和控制预算限额至关重要;设计良好的治理机制不能仅仅依靠单个团队。CIO及I&O领导者需要考虑以下问题,以建立有效的云成本的治理机制。
- 不要依靠专门的财务运营(FinOps)团队来负责云成本治理:云成本治理不应仅仅依赖专门的财务运营团队,而应让多个职能部内都参与进来,并将技能融入到不同的角色中。
- 负责建立云成本的治理机制需要跨团队合作:稳健的治理机制是成功实施云财务管理(CFM)的关键基础。
- 实施云数据和分析(D&A)财务治理应遵循最佳实践:建立针对云的财务治理,使业务成果与最佳数据和分析定价模型保持一致。这一举措可解决一系列问题,如财务目标平衡、定价模式比较、去中心化控制管理。
实施有效的成本管理
云成本管理除了进行成本优化之外,CIO及I&O领导者还应考虑如下几方面的问题。
- 启动云成本管理:配置的每一项云资源都会对业务运营成本产生直接财务影响。云端运营以动态化的资源消耗为主,而数据中心成本管理方面的控制和现有流程不够健全,难以满足这一运营模式的需求。
- 从云成本角度管理云服务提供商:云卓越中心团队应与采购团队合作管理云服务提供商,重点关注财务管理而非仅仅削减成本。
- 使用财务运营工具来管理和优化云成本:为应对不断发展的云财务管理活动,工具和服务市场在过去几年中也显著扩大。做出明智采购决策的关键是在工具选择过程中使用一系列正确的输入标准。
管混合云成本:标记或标签是区分私有云和公有云中共作负载的基础,而制定明确的标签策略对于确保一致性至关重要。标签策略实施之后,企业可利用标签实现成本治理、访问控制、自动化和DevOps。
0赞好文章,需要你的鼓励
推荐文章
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。