时至今日,在企业业务中引入私有/混合云策略早已不是什么新鲜事。然而,我们该如何确保自己的云策略能够获得成功?很明显,我们首先需要明确如何量化成功标准。
1. 企业成员(通常是指业务及应用程序所有者)是否自愿使用云。
2. 您需要有能力向其证明将应用运行在云中可实现助益。
在实现上述目标后,大家还需要提供云运营指标以反映新型业务用例。下面我们将一同了解此类指标:
1. 营收与营收增长
2. 成本与预期成本增长
3. 利润(营收减去成本)
4. 市场份额与市场份额增长
5. 新型目标市场增幅
6. 资本回报
通过对业绩的评判,企业能够建立起这样一套良好的成功量化指标。当然,以上只是财务角度的量化标准。不过作为这些指标的核心属性,可以看到其反映了企业的运营状况。因此,我们需要将注意力集中在业务表现与云绩效这两大方面。
如何衡量您的私有/混合云绩效
首先需要了解站在客户角度考虑问题。客户希望我们的云服务实现怎样的效果? 要回答这个问题,我们要明确自己当初为何选择使用私有/混合云。作为主要理由之一,这可能是因为我们无法从租户共享式公有云中获取必要的可靠性与性能。因此,您的受众也许希望云策略能够满足以下要求:
1.保证可用性并获得用于衡量及证明该可用性的指标
2. 保证性能并获得用于证明该性能的指标
3. 保证通量并获得用于证明该通量的指标
在以上三条中,可用性是最易于理解及量化的指标。我们可以轻松利用现有工具检测Web服务器的运行状况,并衡量成功完成事务的具体百分比。通过这一方式,我们也能够轻松了解用户未进行实操时,应用是否仍运转良好。
但在性能与通量方面,量化工作往往变得比较复杂。系统管理员一般会查看各类资源利用率来衡量性能与通量,包括CPU、内存、网络以及存储(IOPS)。问题在于,动态与虚拟化系统中的资源利用率往往无法准确反映性能水平。在这些环境中,我们需要使用新的定义方式:
1. 性能: 对于私有/混合云,性能定义应当为重要事务及应用程序的事务响应时间。对于支持应用程序及事务之基础架构内的全部层,性能定义则应为基础架构中各个层的等待时间。具体来讲,这意味着支持各个事务与应用的网络与存储组件的实际延迟。
2. 通量: 对于私有/混合云,通量的定义应为单位时间内完成的工作量。对于事务,通量定义则可为每秒调用次数。对于网络,其可为每秒的数据包或字节数。在存储层中,通量通常为每秒I/O操作(即IOPS)。
私有/混合云中的仪控架构
为了能够收集堆栈内各层的性能与通量指标,您需要建立一套仪控架构。大家需要枚举堆栈内各个层与各层组件,而后确定如何获取各层中各组件所需的性能(响应时间与延迟)以及通量指标。具体如下图所示。
一旦您得到了各项关键性指标来源,那么真正艰苦的工作即将开始。单纯收集全部指标并将其纳入大数据后端,并将指标结果交付至用户处以了解基础设施对事务的支持情况还远远不够。为了能够实现真正有效的云仪控策略,大家不仅需要在堆栈中的各个层内提供性能与通量指标,同时还需要了解您的基础设施中哪些虚拟及物理元素会随时间推移对各事务提供支持。具体请参见以下图表。
私有/混合云关系图
总结
有效的私有/混合云仪控策略需要在堆栈中的每一层——从事务到磁盘读写——收集性能与通量指标,并将这些指标与支持各个事务及各应用的每一虚拟与物理基础架构拓扑进行关联。
好文章,需要你的鼓励
2025年1月,OpenAI、软银、甲骨文和MGX联合宣布"星际之门"计划,承诺投资5000亿美元,部署高达10GW算力基础设施。如今,该项目已从白宫发布会上的宏大承诺,演变为一场前所未有规模的基础设施建设实验。项目已扩展至德克萨斯、威斯康星、俄亥俄等多地,并延伸至阿布扎比和挪威。然而,融资争议、合作伙伴摩擦、能源压力及政策监管收紧,正考验着这一"AI工业园"模式能否真正落地。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
加密货币交易所OKX正式推出AI智能体交易市场OKX AI,允许AI代理相互雇佣、自主结算,并建立基于区块链的可携带信誉档案。该平台经过50家早期服务商封测后向开发者开放,依托稳定币和链上支付基础设施,支持全天候微支付。OKX创始人徐明星表示,传统金融基础设施为人类而建,智能体经济需要为自主软件专门设计的基础设施。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。