云采用是多数中国企业机构的一项关键举措,考虑到法规、数据主权和延迟方面的要求,国内的云采用模式主要是混合云。根据Gartner的预测,国内采用混合云的大型企业机构占比在2026年会提高到70%以上,而2021年这一比例不足40%。
目前,中国企业机构很重视云采用和云迁移的规划,但较少为云成本制定优化规划。业务领导者和部分高管受到云供应商的影响,认为云产品性价比非常高。企业机构可能被云迁移初期的低成本所吸引,然后逐渐意识到,如果管理不善,使用云技术的长期成本可能会更高。如果是涉及私有云和多个公有云部署的混合云,这一问题会更加突出。很多基础设施及和运营(I&O)领导者需要优化公有云、私有云基础设施的总成本,但这两种环境的成本优化方式存在差异。
中国的I&O领导者可以采用以下三种方法,进行混合云的成本优化管理。
建立云成本治理流程,采用多样化管理方式
混合云成本管理,不仅仅是运营问题。I&O领导者应加强与业务领导者、采购团队、安全架构师或云架构师的合作,共同建立卓越中心(CCOE)。建立CCOE,有助于明确云成本治理流程,以及根据私有云和公有云环境的差异分别制定成本治理战略。混合云的成本优化非常复杂,需要企业机构云运营各环节之间的紧密合作,同时这也是I&O领导者的机会,可以通过解决成本优化难题来提高自身影响力,更好地完成混合云采用。
I&O领导者应与CCOE共同打造混合云成本治理基础,更好地管理私有云和公有云环境中的云成本,包括:
在私有云环境中,使用标签打造成本追踪的技术基础
如果I&O团队分不清楚谁拥有并使用资源,而且无权在未经许可的情况下对资源进行更改和调配,那么混合云的成本控制,尤其是私有云部分的成本控制会非常艰难。标记或标签是区分私有云工作负载的基础,使用这项技术可以明确划分层级、追踪资源负责人、计算团队成本。这样可以为云资源添加元数据,而且可以进一步了解云成本的构成。
明确定义的标签策略,对于推动标签使用的一致性至关重要。国内企业机构可根据自身情 况,按业务负责人、项目、应用、成本中心ID、企业机构成本报告等进行标签分类。公有 云提供商的标记或标签功能,可以通过元数据来管理资源。标签可以使资源和服务以多种方式分类,快速挖掘常见特征,改善运营管理。企业机构启用标签后,可以将其用于成本治理、访问控制、自动化和DevOps。通过标签来进行资源分类,从长期来看能提高效率和透明度。
使用第三方云成本管理工具或平台
最近,云财务运营(FinOps)成为国内的热点话题。本地云服务提供商也在加大云财务运营投入。根据FinOps基金会技术顾问委员会的定义,FinOps是“不断严谨的云财务管理原则和文化实践,可以推动IT、财务和业务团队协作,共同做出数据驱动的开支决策,帮助企业机构实现业务价值的最大化。”FinOps的核心,是云成本报告、成本修复和成本优化(见图1)。企业机构在使用混合云成本管理工具时,应关注这三方面关键能力,监控资源使用情况,自动释放不活跃的资源,或者在应用负责人的确认下清除无人使用的或“浪费”的资源。
图1:云成本管理生命周期

好文章,需要你的鼓励
Anthropic推出Claude Code的Slack集成功能,让开发者能直接在聊天线程中委托编程任务。这项测试功能于周一以研究预览版形式发布,基于现有Slack集成增加了完整工作流自动化。开发者现在可以标记@Claude启动完整编程会话,Claude会分析消息确定合适的代码库,在线程中发布进度更新并分享审查链接。这反映了行业趋势:AI编程助手正从IDE迁移到团队协作工具中。
波恩大学研究团队首次量化AI训练的材料成本,发现一块GPU含32种元素,93%为重金属。训练GPT-4需消耗约7吨金属材料,其中多为有毒重金属。研究建立了从计算需求到硬件消耗的评估框架,发现通过软硬件优化可减少93%的资源消耗。该研究揭示了AI发展的隐性环境代价,呼吁行业从规模竞赛转向效率革命,实现可持续发展。
AI发展推动数据中心行业迎来前所未有的挑战与机遇。Switch公司消耗内华达州三分之一电力,展现了AI对电力需求的巨大规模。核能成为AI未来发展的关键,单个AI机架功耗可达1.7MW。预计到2030年,数据中心行业将消耗200GW电力。创新的星形配置设计和差异化备电策略正在重新定义数据中心的弹性架构,仅20%的工作负载需要发电机备份。
南开大学团队构建了迄今最大规模的结肠镜AI数据库COLONVQA,包含110万视觉问答条目。他们发现现有AI模型存在泛化能力不足和容易被误导等问题,因此开发了首个具备临床推理能力的结肠镜AI模型COLONR1。该模型采用多专家辩论机制生成推理数据,在综合评估中准确率达56.61%,比传统方法提升25.22%,为智能结肠镜诊断从图像识别向临床推理的转变奠定了基础。