时至今日,在企业业务中引入私有/混合云策略早已不是什么新鲜事。然而,我们该如何确保自己的云策略能够获得成功?很明显,我们首先需要明确如何量化成功标准。
1. 企业成员(通常是指业务及应用程序所有者)是否自愿使用云。
2. 您需要有能力向其证明将应用运行在云中可实现助益。
在实现上述目标后,大家还需要提供云运营指标以反映新型业务用例。下面我们将一同了解此类指标:
1. 营收与营收增长
2. 成本与预期成本增长
3. 利润(营收减去成本)
4. 市场份额与市场份额增长
5. 新型目标市场增幅
6. 资本回报
通过对业绩的评判,企业能够建立起这样一套良好的成功量化指标。当然,以上只是财务角度的量化标准。不过作为这些指标的核心属性,可以看到其反映了企业的运营状况。因此,我们需要将注意力集中在业务表现与云绩效这两大方面。
如何衡量您的私有/混合云绩效
首先需要了解站在客户角度考虑问题。客户希望我们的云服务实现怎样的效果? 要回答这个问题,我们要明确自己当初为何选择使用私有/混合云。作为主要理由之一,这可能是因为我们无法从租户共享式公有云中获取必要的可靠性与性能。因此,您的受众也许希望云策略能够满足以下要求:
1.保证可用性并获得用于衡量及证明该可用性的指标
2. 保证性能并获得用于证明该性能的指标
3. 保证通量并获得用于证明该通量的指标
在以上三条中,可用性是最易于理解及量化的指标。我们可以轻松利用现有工具检测Web服务器的运行状况,并衡量成功完成事务的具体百分比。通过这一方式,我们也能够轻松了解用户未进行实操时,应用是否仍运转良好。
但在性能与通量方面,量化工作往往变得比较复杂。系统管理员一般会查看各类资源利用率来衡量性能与通量,包括CPU、内存、网络以及存储(IOPS)。问题在于,动态与虚拟化系统中的资源利用率往往无法准确反映性能水平。在这些环境中,我们需要使用新的定义方式:
1. 性能: 对于私有/混合云,性能定义应当为重要事务及应用程序的事务响应时间。对于支持应用程序及事务之基础架构内的全部层,性能定义则应为基础架构中各个层的等待时间。具体来讲,这意味着支持各个事务与应用的网络与存储组件的实际延迟。
2. 通量: 对于私有/混合云,通量的定义应为单位时间内完成的工作量。对于事务,通量定义则可为每秒调用次数。对于网络,其可为每秒的数据包或字节数。在存储层中,通量通常为每秒I/O操作(即IOPS)。
私有/混合云中的仪控架构
为了能够收集堆栈内各层的性能与通量指标,您需要建立一套仪控架构。大家需要枚举堆栈内各个层与各层组件,而后确定如何获取各层中各组件所需的性能(响应时间与延迟)以及通量指标。具体如下图所示。
一旦您得到了各项关键性指标来源,那么真正艰苦的工作即将开始。单纯收集全部指标并将其纳入大数据后端,并将指标结果交付至用户处以了解基础设施对事务的支持情况还远远不够。为了能够实现真正有效的云仪控策略,大家不仅需要在堆栈中的各个层内提供性能与通量指标,同时还需要了解您的基础设施中哪些虚拟及物理元素会随时间推移对各事务提供支持。具体请参见以下图表。
私有/混合云关系图
总结
有效的私有/混合云仪控策略需要在堆栈中的每一层——从事务到磁盘读写——收集性能与通量指标,并将这些指标与支持各个事务及各应用的每一虚拟与物理基础架构拓扑进行关联。
好文章,需要你的鼓励
随着GPU成为AI工作负载训练和运营的关键,越来越多的云服务提供商开始提供云GPU实例。这为希望避免部署GPU硬件费用和复杂性的组织带来好消息。云GPU实例可按超大规模与专业化提供商、通用与专用实例、共享与独占服务器进行分类。选择时需考虑工作负载类型、GPU类型、成本、延迟和控制级别等因素。
这是一项关于计算机视觉技术突破的研究,由多家知名院校联合完成。研究团队开发了LINO-UniPS系统,能让计算机像人眼一样从不同光照下的照片中准确识别物体真实的表面细节,解决了传统方法只能在特定光照条件下工作的局限性,为虚拟现实、文物保护、工业检测等领域带来重要应用前景。
企业云服务平台IFS收购硅谷代理AI专家theLoops,推出"工业AI"概念。该技术旨在创建具备语义环境感知能力的自主AI代理,专门服务于制造、能源、建筑等资产密集型行业。这些工业AI代理能够理解业务职责,遵循行业规则,与人类协同工作,执行实际工作任务而非简单的聊天或辅助功能,为企业带来可衡量的生产力提升和投资回报。
这篇文章介绍了北京人工智能研究院开发的OmniGen2模型,一个能够同时处理文字转图像、图像编辑和情境生成的全能AI系统。该模型采用双轨制架构,分别处理文本和图像任务,并具备独特的自我反思机制,能够自动检查和改进生成结果。研究团队还开发了专门的数据构建流程和OmniContext评测基准,展现了开源模型的强大潜力。