大型机:机器学习和英特尔ops的首选平台

近来,从Netflix通过播放记录获取用户喜好,到自动驾驶汽车的出现,我们周围的一切都在变得智能化。那么, 大型机管理为什么不能一样智能化呢?

至顶网CIO与应用频道 08月24日 北京消息:近来,从Netflix通过播放记录获取用户喜好,到自动驾驶汽车的出现,我们周围的一切都在变得智能化。那么, 大型机管理为什么不能一样智能化呢?

大型机承载着执行重要任务的应用程序,可同时服务上万用户、支持上万个应用程序和接入设备。看看这些统计数据:

70%的企业交易涉及大型机

全球70-80%的企业数据存储在大型机上

从移动应用程序到数据库,z Systems平台是当今处理和分析这些企业数据最具成本效益和安全保障的平台。随着数据分析以及连接到大型机的移动应用使用量和吞吐量不断增长,使得本就巨大的大型机操作压力进一步增加。因此大型机自身需要具有处理自己的操作数据性数据的能力。

操作性数据:保证性能与复杂性间的平衡

我们要怎样在不影响性能的前提下应对复杂性呢?通过大型机的机器学习和操作智能,我们的工作也可以更加智能,而不是更辛苦。

这就是为什么在CA,我们将机器学习和高级分析功能融入到产品中,在2016年CA World上, CA发布了的“CA大型机操作智能” (Mainframe operation Intelligence,简称MOI)这款产品。CA以客户为中心进行创新,将深厚的大型机专业知识和自主学习嵌入到我们的解决方案中,在出现问题前主动预防,并在出现问题后减少在探查问题根源方面对于大型机专家的依赖。

以灵活性简单性为设计理念,MOI智能分析引擎是基于Docker技术开发的智能操作软件, 使得客户可以轻松部署最先进的分析技术,作为其现有CA软件投资的一部分。MOI也可以在z Systems的Linux、x86和云之间轻松移植,帮助客户降低成本。

AIOps:为什么还要找答案?“预计避免时间”直接告诉你

CA大量投资于机器学习、高级分析和自动化领域,以推动更智能的大型机管理,不仅给出“平均恢复时间”(MTTR),更重要的是“预计避免时间”(PTTA)。

这意味着我们已转向被Gartner称为AIOps的新类别。

“AIOps平台是对之前所说的IT运营分析 (ITOA)技术的发展和扩展。在服务台、自动化和监控等所有主要ITOM功能中,大数据和机器学习技术重要性(由于数字业务需求造成的)和使用量日益增加,因而AIOPs应运而生。”(Gartner,《将AIOps平台应用于更广泛的数据库中可获取独特的业务洞察》;发布时间:2016年7月1日;ID:G00296361;分析员:Colin Fletcher)

在CA,我们认为 MTTR只是解决问题的一部分,因为它只可以在问题发生后提醒大型机系统操作员――被动解决问题。这种方法的问题在于:你的网络运营中心控制台警报可能已经响成一片“红色海洋”,而关键告警却没人注意到。

通常当你看到警报的时候都为时已晚了――问题已经发生。举个例子,这可能意味着客户不能在手机应用上刷新他们的银行余额,从而导致客户流失。如果你等着警报响起,就没法做好客户体验,并且这并不能使你的应用(和你的公司)看起来更智能。

另一方面,PTTA会提供预测,通过寻找早期信号、预测采取行动所需的时间,使得运维人员可以在问题发生之前有所行动,避免问题发生。

区别于其他解决方案将智能分析功能与解决方案本身分离,CA将智能分析功能嵌入到系统视图中,因此大型机运维人员可提前预测到问题的发生。

例如,如果你知道20%的客户问题发生在80%的时间里,CA大型MOI中的分析功能使用模式识别和行为算法给出必要的补救步骤,并自动执行整个修复过程。

然后,监控指标的阈值将会自动生成,并基于正常的性能模式应用于正在进行的操作中。当检测到超过阈值的异常情况(异常现象)时,系统会发出警报,同时 “平滑”算法会防止过度警报。 CAMOI提供多用户协作性分析工具,可以加速问题根本原因分析, 以帮助解决问题。

PTTA的运作就像预感到感冒时开始多喝水、摄取额外的维生素C、多睡觉一样,而MTTR就是感冒之后服用药物且治愈所需的时间。问题是“感冒后或者在大型机遭遇运行缓慢、宕机或其他性能问题后,多久才能恢复?”

这就是大型机智能操作与非智能操作的区别。

来源:业界供稿

0赞

好文章,需要你的鼓励

2017

08/24

16:21

分享

点赞

邮件订阅
白皮书