南非采矿承包商的云迁移噩梦

当这家南非工程与采矿承包商因全面云迁移而身陷泥潭之际,Murray & Roberts公司CIO Hilton Currie给出了艰难却卓实的建议——重返传统IT堆栈。

当这家南非工程与采矿承包商因全面云迁移而身陷泥潭之际,Murray & Roberts公司CIO Hilton Currie给出了艰难却卓实的建议——重返传统IT堆栈。

就在几年之前,“数字化转型”开始进入每一位CIO的议程。他们有责任、也必须替企业探索云计算中的种种价值可能性。他们要考虑的问题不再是是否应该迁移至云端,而是如何迁移、何时才能抵达彼岸。

面对2016年南非云服务市场的蓬勃发展,当地工程与采矿承包商Murray & Roberts的CIO Hilton Currie也坐不住了。于是,他决心带领这家价值1.4亿美元、且业务仍在不断增长的企业踏上云探索之路。然而,事情并没能按计划顺利推进,而且类似的问题无论是在南非之外、还是在其他行业,也可谓所在多有。最终,Currie做出了艰难的决定——Murray & Roberts只能重新回归传统IT堆栈。换言之,M&R必须勇敢承认,自己的IT转型战略已经彻底失败。

Currie最近在接受外媒CIO.com采访时,回顾了这家矿业公司堪称噩梦的云迁移之旅,分享了当初为什么选择迁移,最终又因何决定放弃。

记者:当初,是什么促使Murray & Roberts踏上了云迁移之旅?

Hilton Currie: 其实一直到2015年,我们的业务都是100%本地化运行的,而且从来没遇到过重大问题。最早的危险信号,应该是我们长期使用主从数据中心设施的时候。当时我们的绝大部分业务都运行在主生产环境上,另外还有一套热灾备辅助环境,但早已年久失修、临近生命周期的终点。这肯定是个巨大的风险。到这时,我们的生产环境已经坚持不了多久了,所以必须要做出决定。

所以我们开始跟外包合作伙伴讨论能不能把IT支持服务交给他们,而对方则建议我们使用成本效益更高的云服务。老实说,2016年那会云计算其实谈不上成本效益更高。但对方很有信心,表示只要我们愿意把从服务器应用程序到技术支持的所有项目都外包给他们,并接纳他们提供的托管公有云,那整个迁移不会有任何问题。我们又比较了一下建设新基础设施的资本投入,发现云计算在财务上确实很有吸引力。所以M&R的云迁移之旅就这么开始了。

拍板之后,迁移进展如何?

我们的第一波重大迁移始于2017年第一季度,当时已经有很多设备报废清退,所以必须下决心行动起来了。我们选择了一家本地托管云服务商,他们跟我们的外包合作伙伴有联系,同时也隶属于一家大型跨国集团。花费的时间虽然比预期稍长了一些,但到2017年11月,我们几乎全面实现了云端运营。到这时候,从大型ERP系统到小型定制化系统都已经运行在云上。

我们还聘请了第三方独立顾问来分析某些系统和许可证。但到2018年初,我们还是遇到了第一个重大问题,原因是这家负责审计的第三方遗漏了某些许可证的使用条款。例如,微软对云端永久使用的软件设置了相当严苛的限制,特别是SQL Server。就是说,如果实际使用的底层硬件并不归用户所有,那么某些许可证将被宣布无效。很遗憾,我们的许可专家并没留意到这一点。为了解决问题,我们只能从永久许可证转为订阅许可证。说起来简单,但因为我们购买过永久许可的部分系统已经比较陈旧,所以为了运行稳定,我们只能先选择当前版本的SQL Server、再随后向下降四、五个版本,这样才能跟当前使用的ERP及其他系统顺畅匹配。这会带来高昂的成本,所以我们打算把受许可证影响的服务迁回本地,同时将SQL Server全部留在自有基础设施之内。但这套方案的成本同样不低,毕竟现在我们就有两套基础设施需要照料:一套是用于运行其余应用程序的云端系统,其二就是承载SQL Server及部分许可冲突服务的本地基础设施。这套混合体系带来了不少挑战,也成为管理层挥之不去的噩梦。我们坚持以这种方式运营了大概六到八个月。在此期间,随着云服务热度的提升,外包供应商的托管云平台又陆续入驻了不少新客户。伴随着资源压力,供应商决定施加速率限制,我们的日子更不好过了。

南非采矿承包商的云迁移噩梦

Murray & Roberts公司CIO Hilton Currie

那后来你是怎么意识到云迁移没有意义的?整体迁移回本地基础设施是不是非常困难?

最开始,我们确实能运用云平台上的全部性能,没有丝毫限制。但突然有一天,他们开始设置上限。如果我们需要更高的性能就得额外付费,所以原本的商业模式瞬间崩塌。我们也试图加以弥补,但最终情况到了根本无法正常运行的地步。我们的整个上云周期大约用了一年半,但过了一年左右业务就陷入了困境。应用程序开始失效,电子邮件和电话也无法正常运转,就连ERP系统也不能顺畅使用。在最极端的情况下,我们的财务团队可能需要15分钟才能打开Excel文件。我们也提出过抗议,对方取消了部分速率限制,但我们也同时开始筹划替代性方案。

2019年3月左右,我们正式决定迁回本地。到2020年年中,我们已经完成了回迁工作。对我来说,这个决定做得非常果断。有段时间,我感觉自己已经被身上的担子压得喘不过气来。我知道上云的选择已经影响到了每一个人,而且公司内有种等待IT体系彻底崩溃的绝望气氛。

在Murray & Roberts,IT部门需要向集团财务总监报告,所以我跟他认真谈了谈,解释说这段经历并不纯粹是坏事。我制定了一份详尽的路线图,强调目前公司的状态已经很差了,但并不是没办法解决。最后,我给出了回归本地的预算数字,并证明只需要短短三年,转为本地基础设施的总体成本就将低于继续坚持使用云服务。他很快接受了这个建议,但我还记得当时的谈话推进得非常艰难。早在2016年时,是我们技术部门向管理层推荐上云,他们决定支持并站在我们一边。但就在一年半之后,我们又想重返本地,在情感上确实让对方很难接受。但我可以断言,转回本地私有云才是正确方向。

那M&R的本地数据中心目前部署了哪些系统?你在云上发现的问题是否都已得到解决?

说是回归原点,但其实现在的本地基础设施已经跟过去不一样了。我们认真梳理了全部已有系统,希望透彻理解它们对业务的重要性及所处位置。在整个梳理过程中,我们尽量把握从零构建的机会,对部分系统进行了升级。如此一来,事态终于向着我们期望的方向顺利推进。当然,我们也做了不少整合工作。当初着手上云时,我们曾运行着超过300台服务器;但到现在重返本地时,我们的最终目标是将服务器控制在180台左右。

其实云市场的变化一刻没有停歇,所以你未来会考虑再次上云吗?

我们对云并没有任何成见。我们知道云计算有助于增加价值,而且在某些领域表现良好。事实上,我们正在推动一波全面的Office 365迁移。但这次我们只会涵盖部分系统,而且选择更有针对性的迁移方法。云这个词太大了,真正重要的是要利用哪些云特性、云承诺为自身业务带来怎样的价值。如果单纯是为了省钱而选择云,那实在是大可不必,因为云服务用起来并不便宜。如果单纯是为了性能而选择云,也不一定能轻松达到预期,因为这里的影响因素既多且杂。

特别是在南非,跨国云服务商在带宽和吞吐量方面存在很多问题,毕竟他们的主力设施都位于欧洲或美洲。既然借助私有云的虚拟环境就能获得同样的灵活性,而且没有太高的敏捷性或大规模扩展需求,那真有必要使用公有云吗?我们发现,一套托管在自有T4数据中心基础设施上、管理良好且完全冗余的私有云虚拟环境,已经能够完美承托M&R的业务。自2020年年中以来,我们一直在以这种方式运营,效果相当不错。

回顾这段经历,你能不能给其他CIO提供一点经验和心得?

其实现在看来,我们当初做的决定并不算错。期间最重要的经验,应该是要关注大局吧。身为CIO,大家必须非常清楚自己的长期发展路线图,避免出现任何意外。那些宣传广告确实很吸引人,但真正重要的还是研究明白许可规则和使用条款,因为很多供应商都会在这里动手脚。而且哪怕最初签订的合同条款没有问题,条款内容往往也会随时间推移而有所变化。所以,请确保在迁移之前准备好了备份或回滚预案,这样当企业陷入困境时,我们才能及时采购新设备并全面回迁,尽可能削减对业务造成的负面影响。当然,我没办法向大家推荐完整的上云和迁移方法,这里的细节和变量难以论说。

经历了这么多,你对其他心怀抱负的CIO有没有什么建议?

大部分CIO所欠缺的,就是与业务部门的充分交流。CIO这个角色要关注的不只是IT部门,更要与业务部门以及各重要利益相关方建立合作关系,这才是事业成功的前提。除了关注技术治理,CIO还要关注合规性、流程等要素。如果技术立场不能与业务需求保持一致,CIO就会成为孤家寡人,因为IT提供的服务与业务的目标之间无法对接。所以千万别被花里胡哨的技术更新迷住双眼,这些并不是重点。真正的重点,应该是采用正确的技术提高生产力、促进业务运作,这才是我们CIO需要关注的永恒议题。

来源:至顶网CIO与CTO频道

0赞

好文章,需要你的鼓励

2022

09/09

09:53

分享

点赞

邮件订阅