云采用是多数中国企业机构的一项关键举措,考虑到法规、数据主权和延迟方面的要求,国内的云采用模式主要是混合云。根据Gartner的预测,国内采用混合云的大型企业机构占比在2026年会提高到70%以上,而2021年这一比例不足40%。
目前,中国企业机构很重视云采用和云迁移的规划,但较少为云成本制定优化规划。业务领导者和部分高管受到云供应商的影响,认为云产品性价比非常高。企业机构可能被云迁移初期的低成本所吸引,然后逐渐意识到,如果管理不善,使用云技术的长期成本可能会更高。如果是涉及私有云和多个公有云部署的混合云,这一问题会更加突出。很多基础设施及和运营(I&O)领导者需要优化公有云、私有云基础设施的总成本,但这两种环境的成本优化方式存在差异。
中国的I&O领导者可以采用以下三种方法,进行混合云的成本优化管理。
建立云成本治理流程,采用多样化管理方式
混合云成本管理,不仅仅是运营问题。I&O领导者应加强与业务领导者、采购团队、安全架构师或云架构师的合作,共同建立卓越中心(CCOE)。建立CCOE,有助于明确云成本治理流程,以及根据私有云和公有云环境的差异分别制定成本治理战略。混合云的成本优化非常复杂,需要企业机构云运营各环节之间的紧密合作,同时这也是I&O领导者的机会,可以通过解决成本优化难题来提高自身影响力,更好地完成混合云采用。
I&O领导者应与CCOE共同打造混合云成本治理基础,更好地管理私有云和公有云环境中的云成本,包括:
在私有云环境中,使用标签打造成本追踪的技术基础
如果I&O团队分不清楚谁拥有并使用资源,而且无权在未经许可的情况下对资源进行更改和调配,那么混合云的成本控制,尤其是私有云部分的成本控制会非常艰难。标记或标签是区分私有云工作负载的基础,使用这项技术可以明确划分层级、追踪资源负责人、计算团队成本。这样可以为云资源添加元数据,而且可以进一步了解云成本的构成。
明确定义的标签策略,对于推动标签使用的一致性至关重要。国内企业机构可根据自身情 况,按业务负责人、项目、应用、成本中心ID、企业机构成本报告等进行标签分类。公有 云提供商的标记或标签功能,可以通过元数据来管理资源。标签可以使资源和服务以多种方式分类,快速挖掘常见特征,改善运营管理。企业机构启用标签后,可以将其用于成本治理、访问控制、自动化和DevOps。通过标签来进行资源分类,从长期来看能提高效率和透明度。
使用第三方云成本管理工具或平台
最近,云财务运营(FinOps)成为国内的热点话题。本地云服务提供商也在加大云财务运营投入。根据FinOps基金会技术顾问委员会的定义,FinOps是“不断严谨的云财务管理原则和文化实践,可以推动IT、财务和业务团队协作,共同做出数据驱动的开支决策,帮助企业机构实现业务价值的最大化。”FinOps的核心,是云成本报告、成本修复和成本优化(见图1)。企业机构在使用混合云成本管理工具时,应关注这三方面关键能力,监控资源使用情况,自动释放不活跃的资源,或者在应用负责人的确认下清除无人使用的或“浪费”的资源。
图1:云成本管理生命周期
好文章,需要你的鼓励
Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
中科院微电子研究所团队揭示深度学习中感知优化与质量评估存在意外不对称现象。研究发现评估性能优秀的模型在训练指导中效果有限,对抗性训练具主导作用,传统卷积网络在某些场景仍具优势。这项发现颠覆了"评估性能等同于优化能力"的传统认知,为AI图像处理技术改进提供新方向。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
香港科技大学研究团队开发了MOSS-ChatV视频AI系统,通过创新的"过程推理奖励"机制解决了现有视频AI推理过程不一致的问题。该系统不仅能准确预测视频中的未来事件,还能提供清晰的推理解释。研究构建了MOSS-Video数据集,采用动态时间规整算法训练模型,在多个视频理解任务上取得显著性能提升,为视频AI的可解释性发展开辟了新方向。