时至今日,在企业业务中引入私有/混合云策略早已不是什么新鲜事。然而,我们该如何确保自己的云策略能够获得成功?很明显,我们首先需要明确如何量化成功标准。
1. 企业成员(通常是指业务及应用程序所有者)是否自愿使用云。
2. 您需要有能力向其证明将应用运行在云中可实现助益。
在实现上述目标后,大家还需要提供云运营指标以反映新型业务用例。下面我们将一同了解此类指标:
1. 营收与营收增长
2. 成本与预期成本增长
3. 利润(营收减去成本)
4. 市场份额与市场份额增长
5. 新型目标市场增幅
6. 资本回报
通过对业绩的评判,企业能够建立起这样一套良好的成功量化指标。当然,以上只是财务角度的量化标准。不过作为这些指标的核心属性,可以看到其反映了企业的运营状况。因此,我们需要将注意力集中在业务表现与云绩效这两大方面。
如何衡量您的私有/混合云绩效
首先需要了解站在客户角度考虑问题。客户希望我们的云服务实现怎样的效果? 要回答这个问题,我们要明确自己当初为何选择使用私有/混合云。作为主要理由之一,这可能是因为我们无法从租户共享式公有云中获取必要的可靠性与性能。因此,您的受众也许希望云策略能够满足以下要求:
1.保证可用性并获得用于衡量及证明该可用性的指标
2. 保证性能并获得用于证明该性能的指标
3. 保证通量并获得用于证明该通量的指标
在以上三条中,可用性是最易于理解及量化的指标。我们可以轻松利用现有工具检测Web服务器的运行状况,并衡量成功完成事务的具体百分比。通过这一方式,我们也能够轻松了解用户未进行实操时,应用是否仍运转良好。
但在性能与通量方面,量化工作往往变得比较复杂。系统管理员一般会查看各类资源利用率来衡量性能与通量,包括CPU、内存、网络以及存储(IOPS)。问题在于,动态与虚拟化系统中的资源利用率往往无法准确反映性能水平。在这些环境中,我们需要使用新的定义方式:
1. 性能: 对于私有/混合云,性能定义应当为重要事务及应用程序的事务响应时间。对于支持应用程序及事务之基础架构内的全部层,性能定义则应为基础架构中各个层的等待时间。具体来讲,这意味着支持各个事务与应用的网络与存储组件的实际延迟。
2. 通量: 对于私有/混合云,通量的定义应为单位时间内完成的工作量。对于事务,通量定义则可为每秒调用次数。对于网络,其可为每秒的数据包或字节数。在存储层中,通量通常为每秒I/O操作(即IOPS)。
私有/混合云中的仪控架构
为了能够收集堆栈内各层的性能与通量指标,您需要建立一套仪控架构。大家需要枚举堆栈内各个层与各层组件,而后确定如何获取各层中各组件所需的性能(响应时间与延迟)以及通量指标。具体如下图所示。
一旦您得到了各项关键性指标来源,那么真正艰苦的工作即将开始。单纯收集全部指标并将其纳入大数据后端,并将指标结果交付至用户处以了解基础设施对事务的支持情况还远远不够。为了能够实现真正有效的云仪控策略,大家不仅需要在堆栈中的各个层内提供性能与通量指标,同时还需要了解您的基础设施中哪些虚拟及物理元素会随时间推移对各事务提供支持。具体请参见以下图表。
私有/混合云关系图
总结
有效的私有/混合云仪控策略需要在堆栈中的每一层——从事务到磁盘读写——收集性能与通量指标,并将这些指标与支持各个事务及各应用的每一虚拟与物理基础架构拓扑进行关联。
好文章,需要你的鼓励
Xbox 部门推出了名为 Muse 的生成式 AI 模型,旨在为游戏创造视觉效果和玩法。这一举措反映了微软全面拥抱 AI 技术的战略,尽管游戏开发者对 AI 持谨慎态度。Muse 不仅可能提高游戏开发效率,还有望实现老游戏的现代化改造,但其实际效果和对行业的影响仍有待观察。
Sonar收购AutoCodeRover,旨在通过自主AI代理增强其代码质量工具。这项收购将使Sonar客户能够自动化调试和问题修复等任务,让开发者将更多时间用于改进应用程序而非修复bug。AutoCodeRover的AI代理能够自主修复有问题的代码,将与Sonar的工具集成,提高开发效率并降低成本。
人工智能正在推动数据中心的变革。为满足 AI workload 的需求,数据中心面临前所未有的电力消耗增长、散热压力和设备重量挑战。应对这些挑战需要创新的解决方案,包括 AI 专用硬件、可再生能源、液冷技术等。同时,数据中心还需平衡监管压力和社区关切。未来数据中心的发展将决定 AI 技术能否实现其变革性潜力。