时至今日,在企业业务中引入私有/混合云策略早已不是什么新鲜事。然而,我们该如何确保自己的云策略能够获得成功?很明显,我们首先需要明确如何量化成功标准。
1. 企业成员(通常是指业务及应用程序所有者)是否自愿使用云。
2. 您需要有能力向其证明将应用运行在云中可实现助益。
在实现上述目标后,大家还需要提供云运营指标以反映新型业务用例。下面我们将一同了解此类指标:
1. 营收与营收增长
2. 成本与预期成本增长
3. 利润(营收减去成本)
4. 市场份额与市场份额增长
5. 新型目标市场增幅
6. 资本回报
通过对业绩的评判,企业能够建立起这样一套良好的成功量化指标。当然,以上只是财务角度的量化标准。不过作为这些指标的核心属性,可以看到其反映了企业的运营状况。因此,我们需要将注意力集中在业务表现与云绩效这两大方面。
如何衡量您的私有/混合云绩效
首先需要了解站在客户角度考虑问题。客户希望我们的云服务实现怎样的效果? 要回答这个问题,我们要明确自己当初为何选择使用私有/混合云。作为主要理由之一,这可能是因为我们无法从租户共享式公有云中获取必要的可靠性与性能。因此,您的受众也许希望云策略能够满足以下要求:
1.保证可用性并获得用于衡量及证明该可用性的指标
2. 保证性能并获得用于证明该性能的指标
3. 保证通量并获得用于证明该通量的指标
在以上三条中,可用性是最易于理解及量化的指标。我们可以轻松利用现有工具检测Web服务器的运行状况,并衡量成功完成事务的具体百分比。通过这一方式,我们也能够轻松了解用户未进行实操时,应用是否仍运转良好。
但在性能与通量方面,量化工作往往变得比较复杂。系统管理员一般会查看各类资源利用率来衡量性能与通量,包括CPU、内存、网络以及存储(IOPS)。问题在于,动态与虚拟化系统中的资源利用率往往无法准确反映性能水平。在这些环境中,我们需要使用新的定义方式:
1. 性能: 对于私有/混合云,性能定义应当为重要事务及应用程序的事务响应时间。对于支持应用程序及事务之基础架构内的全部层,性能定义则应为基础架构中各个层的等待时间。具体来讲,这意味着支持各个事务与应用的网络与存储组件的实际延迟。
2. 通量: 对于私有/混合云,通量的定义应为单位时间内完成的工作量。对于事务,通量定义则可为每秒调用次数。对于网络,其可为每秒的数据包或字节数。在存储层中,通量通常为每秒I/O操作(即IOPS)。
私有/混合云中的仪控架构
为了能够收集堆栈内各层的性能与通量指标,您需要建立一套仪控架构。大家需要枚举堆栈内各个层与各层组件,而后确定如何获取各层中各组件所需的性能(响应时间与延迟)以及通量指标。具体如下图所示。
一旦您得到了各项关键性指标来源,那么真正艰苦的工作即将开始。单纯收集全部指标并将其纳入大数据后端,并将指标结果交付至用户处以了解基础设施对事务的支持情况还远远不够。为了能够实现真正有效的云仪控策略,大家不仅需要在堆栈中的各个层内提供性能与通量指标,同时还需要了解您的基础设施中哪些虚拟及物理元素会随时间推移对各事务提供支持。具体请参见以下图表。
私有/混合云关系图
总结
有效的私有/混合云仪控策略需要在堆栈中的每一层——从事务到磁盘读写——收集性能与通量指标,并将这些指标与支持各个事务及各应用的每一虚拟与物理基础架构拓扑进行关联。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
马里兰大学研究团队通过测试25个大型AI模型发现,即使最先进的AI评判系统在需要同时考虑多个标准时也会出现严重偏差,准确率仅32%-53%。研究构建了Multi-Crit评测基准,揭示了AI在多标准权衡中的根本性局限,为改进AI评判系统的公平性和可靠性提供了重要参考,对AI在内容审核、产品评价等应用场景具有重要指导意义。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
南京理工大学团队开发ViLoMem框架,首次实现AI的双流记忆机制,分别处理视觉和逻辑错误。该系统模仿人类认知,让AI能从错误中持续学习,在数学推理等多模态任务中显著提升准确率,为AI从被动工具向主动学习伙伴的转变提供了重要技术突破。