云为IT提供了全新的成本模型,基于弹性和按需付费的方式。大多数公司不得不重新考虑他们的项目计划,更好的使用云,但很多公司并没有意识到很容易就会部署的太多,这一挑战被称为云服务滥用。
除非你采取措施控制它,云服务滥用可能会破坏你的项目计划。 云服务滥用是指不断增加云资源,使得部署变得非常昂贵。
公司通常会引用三个云服务滥用的原因:缺乏对云资源的总体协调, 多个云供应商的不合理运用,以及为一个应用配置过多的资源。然而,只要有合理的云资源管理,这一切都是可以避免的。
总体协调,设立政策是关键
云计算是一项支出,而不是一个资本项目。很多公司对于IT服务,比如云计算,不进行严格的采购控制,这意味IT部门或业务部门不需要审查,就可以购买新的云服务。
公司的公有云服务是一个虚拟数据中心,需要进行优化,从而共享。这并不意味着总部的IT团队需要管理所有的公有云使用,但他们应该设立基本的指导方针,以确保用户没有浪费云资源。需要设立一个云政策。
云政策应该定义用于支持公司应用的云模型的最小数量,比如基础设施即服务,平台即服务和软件即服务,或者虚拟机和容器。然后,选择提供这些模型的主要的和后备的公有云供应商。要求IT和业务部门从这些供应商中选择公有云服务,并使用计划中包含的模型。
多个供应商可以增加云服务滥用的风险
多个供应商可能会增加服务滥用,使云资源管理更加复杂,因为服务冗余。很多云供应商计划都要求最低资源承诺,特别是涉及专用或指派托管的计划。如果两个部门选择不同的供应商,每个部门都必须满足最低资源要求,那么其他部门也不能使用其他多余资源。
这个问题说明要预防云服务滥用不只是设立政策那么简单。 必须有个人或团队负责监测所有的云合同,确保不违反政策。这个团队还应该将同一个供应商的所有云合同合并,以获得最好的商业条款。
总部的IT部门是最好的选择,没有这个部门的公司可以选择一个员工向高层汇报,比如,首席运营官,负责合同协调。 云协调的任务其实是获取和分配。当你需要一个新的云服务是,与其通过新合同获得,应该从现有合同中,选择合适的云容量,进行分配。
如果容量不够,通过扩展现有合同进行增加,或者取得新合同,但任何应用都不应该独占云资源;而是由容量池享有。
避免过度
以上这些步骤也不能完全消除云服务滥用,仍然可能造成应用的过量资源使用,并造成资源浪费。
当没有IT技能的部门协商云托管合同,或者与第三方经销商或集成商进行交易时,最有可能发生问题。例如,一个应用可能在一个专用的云服务器上运行,或使用高可用性特性,而实际上,该应用并不需要这些功能。 在云服务的资源选择时,其中的问题是,很难判断合适的标准。使用最基本的云服务,进行一个短期的应用试用,或在公司内部的容量池内,使用云资源。
如果这一试用在体验质量(QoE)上出现问题,那么额外的云特性是有必要的。 避免服务滥用和优化云资源管理的最后措施,是不断审查计费和合同续签。公有云用户通常在没有正式审查他们需求和服务成本的情况下,添加云服务。
为了避免这种情况,你需要CFO或应付账款的配合,因为新的收费通常很难在复杂的云账单中找到。任何新的收费都应该是合理的。 云的按需付费模式会导致太多的支出。 企业应该认识到低效的使用和代价过高的风险是分布式云决策的不可避免的后果。尽早解决这些挑战,拥有一个更好的云资源管理计划。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。