扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:ZDNet CIO与应用频道【原创】 2015年6月1日
关键字: 云云众声 互联网+ 联想Tech world 支付宝
ZDNET至顶网CIO与应用频道 06月01日 云云众声:本期的云云众声将讨论三大话题:1.联想Tech World,挺有意思的一场盛会;2.一根光缆“绊倒”的支付宝 和“自黑”的携程;3.ZDnet首届中国互联网+高峰论坛。
云云众声栏目链接:http://voice.zdnet.com.cn/2015/0529/3053997.shtml
嘉宾观点提炼:
【00:00】联想Tech World,挺有意思的一场盛会
联想的Tech World利用了比较常见的一种跨界明星聚合的效应来宣传,在吸引眼球这一点上做的很出色,此次大会是联想产品和理念的一次集中展示,其主要战略方向仍是CEMS,主攻保持双品牌运作,争取达到25的市场占有率。此次大会给人印象联想的形象已有大幅的提升,这类大会的召开也是体现了联想的实力,在国内厂商来说是很难得的。
【08:40】一根光缆“绊倒”的支付宝 和“自黑”的携程
支付宝在27日下午出现网络故障,账号无法登陆,更无法进行转账,而后发布声明说是因为光纤被挖断,这在懂行的人眼中是大有文章。两种可能,一是若真是因为光纤断裂导致的事故,那么只能说明盘子这么大的阿里集团确实在IT管理上水平太低,业务太脆弱;二是,如果不是,那么阿里所称自己所运行的“异地多活”这个概念就闯了祸。双机热备和异地多活是有很明显的区别的,后来支付宝所说的业务切换在异地多活的概念下是不存在的,所以可以看出阿里用的并不是其所称的“异地多活”。
携程于28日出现了APP不能提供服务以及网站瘫痪的问题,一开始其所说的疑似遭受不明攻击也是互联网公司业务受到影响的时候最常见的一种说辞,而实际上这种高级别的大面积删除服务器代码的这种行为很难想象是一个黑客外部攻击,最后确认为内部员工的错误操作。与支付宝相似,不得不提到的就是网络公司的灾备工作。此次事件的恢复时间之长主要在于业务逻辑的重做。
这两件事给我们的警示还是很大的,以前我们更多看到的是这种物理故障,物理破坏,地震,水灾,电力,这种线缆的故障。其实我们更应该看重的是我们业务逻辑上的一种保障,这可能是给我们很多人一种新的课题。
【34:00】ZDnet首届中国互联网+高峰论坛
在国家会议中心举办的第七届云计算大会期间,6月4日下午,至顶网将独家承办“互联网+的高峰论坛”,这次选择的话题是跟制造业的结合,探讨包括德国提出的工业4.0,美国提出的工业互联网,还有中国自己提出来的智能制造2025。论坛中请到了相关的来自于中国还有德国政府相关机构的嘉宾,还有相关的一些企业代表来跟我们分享一下他们是怎么看待互联网跟工业结合之后所带给产业的变革。
以下为访谈实录:
联想Tech World,挺有意思的一场盛会
杨昀煦:各位网友大家好,这里是《云云众声》,我们有半个月没有再见了,而再见这回竟然是我们第100期的《云云众声》了,我们在此也非常感谢各位网友一直以来对我们的支持,也辛苦效民总一直给我们带来这么精彩的内容。
咱们闲言少叙了,直接进入正题,这周确实事件挺多的,大事小情特别多,我们先从联想的Tech World说起,它是一个技术创新大会,我听说大会上也是重量级嘉宾,不只是业界大佬,特别大的明星,您是怎么看这个会的呢?给我们爆料一下这个大会上有哪些明星?
赵效民:这个会如果说它是未来联想长期办下去的,每年一次,是它一年里边自身的创新,它的新品一种集中发布的话,我还是蛮赞成这个活动的。
而且虽然我没有亲历这个会场,但是通过网上的一些传播也看到了说这个大会让我感觉IT厂商办的会还是比较少见的一种比较跨界的这种明星的聚合效应,比如说有范冰冰,任志强,这些传统上很难觉得这类的明星会出现在一个企业级IT厂商的大会上,所以说从吸引眼球这一点来讲联想这次做得还算是很漂亮,给联想点一个赞。
杨昀煦:这次大会说是Tech World技术大会,它这回到底发布了一些什么样的新技术,新产品?
赵效民:其实我觉得光从新的角度来讲没有让我感觉特别多的亮点,新品,新的概念,没有什么太多的亮点,但是它其实是一个集大同的一种集中的展示,以前的一些新品新的战略它这次又重新做了一个展示。
其实它是更聚合地做了一个完整的你说是包装也好,还是亮相也好,还是整体的呈现也好,反正这个大会的主要目的其实是带给业界一种对联想的信心,这么高大上的大会,这么有范儿,又请了这么多跨界的明星,大家肯定会对这样的厂商抱有一种发自内心的信任感或者一种好感。
它基于整体战略的发布,还是跟以前它的战略方向是没有变的,比如说它还是CEMS,C就是代表Clound,E代表企业的应用,M代表移动互联网的行业应用,S就是服务,以这4个概念包装起联想企业级,就是商用业务未来主要的4个支柱,这种Clound云企业应用,移动应用,还有IT服务。
所以,从整体角度来讲反而并不是说有特别大的新意,但是在这个时间点大家都关注比如说收购IBM的X86服务器之后今年是不是有一个正式的怎么样一种进取心,或者说怎么样的一种市场战略,童夫尧也在会后的采访或者说他的宣传上保持双品牌的运作,争取达到25%的市场占有率,这个占有在1/4,野心还是非常大的,这我觉得还是一个比较新鲜的话题,也代表了未来联想的主攻方向。
归根结底不得不承认从去年下半年开始进入,步入收购IBM X86业务的正轨之后,基本上联想给人感觉这种印象改头换面了,至少从外在形象,如果它是一个企业,企业的言谈举止给人感觉档次已经有很大提升了,当然我们也祝愿,面子是没问题了,也希望里子要做得更扎实,更实在。也许你这次大会发表了自己的决心,喊出了口号,下边要去看你的决心和口号具体执行的情况,你们是不是说到年底了我们再回头看你会上的发布,也许我们这时候会有两个评价,一个是名不符实,另外一个是由衷的钦佩,看看年终最终的答卷到底是怎么样的。
杨昀煦:联想可能也是想通过Tech World这个大会体现自己的实力。
赵效民:对,我觉得这样的大会对中国厂商是挺难得的,我也建议越来越多中国IT厂商如果在成长过程中,这类的形象展示应该是必要的。
杨昀煦:也是跟国际接轨,国外的厂商都是这样,您觉得它以后这方面的大会还会延续这样吗?
赵效民:我觉得联想从国外的角度来讲,咱们有这么多次报道会议的经历,我去美国参加四届的思杰的 Synergy,还有VMware的VMworld,其实这都是国外一些比较领先的厂商在某一行业里面办的行业性的自己的用户大会,但是它这个大会已经扩展到行业的影响力了。作为联想我觉得它有实力有这个必要来做这样的会议,你毕竟也是一个全球性的厂商,而且你现在在全球的服务器排名里边它市场占有率排名是第4名,已经真的算是比较高大上的企业了,有些面上的东西还是要做的,因为你是亲自面对客户了,如果你只是一个OEM厂商你给人做贴牌生意你可以不走到台前来,你就是给人在幕后默默做好这种供货就可以了,但是现在你要是以联想的品牌亲自去卖东西的时候你要跟客户有一个更近距离的接触和展示。
所以说我觉得这类的会议一个就可以了,比如说每年有一次Tech World,是联想技术大会,技术世界,行了,OK了,剩下的你愿意组织也可以组织,比如说它的服务器的会,存储的会,不定期的,我觉得不冲突,只要以你的企业名义来做你全年的用户大会,我觉得是有必要的。
一方面你更进一步促进了跟用户的交流,另一方面你在会上再借助媒体给你做更好的市场传播,我觉得对一个企业的长远发展肯定是有好处的。
【08:40】一根光缆“绊倒”的支付宝 和“自黑”的携程
杨昀煦:所以大家昨天可能没有看到范冰冰,或者是想要了解联想的Tech World大会,可以关注我们至顶网的专题,做得也是非常好,很多现场图片什么的。
接下来说两个跟我们息息相关的一个话题,这两天特别火热,前天的支付宝出了问题,昨天携程又出了问题,所以这两件事在安全圈里是很火热,支付宝说是由一根电缆,一根光纤绊倒的支付宝,您对这个事件怎么看?帮我们回顾一下。
赵效民:支付宝,好像是前天下午5点多钟部分用户反映不正常了,要不就登录不上去,手机应用不了,网页打开特别慢。支付宝后来发表声明说是因为一根光纤引起的,但是这个在懂行人的眼里,如果真的就是被一根光纤绊倒的话,只能说支付宝太菜了,但是理智也告诉我们以支付宝阿里集团这么大的盘子,这么一个巨型互联网公司不可能在这类问题上栽跟头,互联网公司它天生是对这种线路问题非常敏感的,因为互联网公司本身它就需要大家来访问我才能做生意的,大家访问你都是通过这些所谓的光纤来接入到你的机房,物理连接上必然要有这一步,所以在很多机房和数据中心里边都是双线甚至是三线,四线的保障,所谓双线肯定现在我们做这种数据中心你不管是自建也好,还是你跟人家去共建共管也好,你的数据链路从带宽出口肯定是躲不开这三家运营商的,联通、移动、电信,再加上底下一些铁通,或者这种小的子公司这些。
所以说你面对的这些都是跟运营商,但是每个运营的链路可能你只买一根,比如说买一根移动的链路,如果移动出问题了你就出问题了,一般来说这种大型的互联网公司都是双线,至少是双线,我买一根联通的也买一根移动的,有一根断了我也能通。所以说要是极端点保险点就是三条,如果你那条线路是特别重要的一条线路,你再给它做一个备份就是4条线路,但是这4条线路出口源头肯定是不一样的,如果要源头是一样的你买它没用,你觉得电信线路好,你以它为主,然后你同样它那边的出口里买了两根光纤拉过来,它那个出口要是坏了你两根光纤不是全完蛋了,所以说有可能你在异地再拉一个光纤或者怎么样,当然那个成本你必须要考量。
话说回来,如果你从这个点来讲支付宝如果就被一根光纤绊倒了,它这个业务实在是太脆弱,所以说马上就被质疑了,后来支付宝的确是他们在做,可能内部,我相信光纤的断有影响,但是可能引发了是它的内部,可能有影响的是它里边的应用逻辑,还有数据同步的一些问题,造成了它做一些数据中心切换的时候,造成了很大的延误。
所以说在这个过程中,支付宝我觉得它技术体系里边很重要的一个问题体现出来了,光纤引发的流量带来的影响肯定有,比如说我双线并发的时候我有一根光纤坏了,等于你有4条车道车的公路有两条车道给封了只能变成两条车道,肯定线路就有很大的堵塞了。在这样的一个数据中心里面按淘宝的说法它做流量的迁移,流量的迁移有些数据也要同步过去,同步过去以后迁移到其他的数据中心,在这个过程中可能需要做数据的对接,应用的同步,应用对接数据的同步,造成了很大的时延,大概有两个小时。
但是,最关键的一点是支付宝强调一点,它叫异地多活,这个词我觉得惹麻烦了。为什么呢?从支付宝这次的应对措施它其实并不是一个异地多活的解决方案,最多是异地多备,怎么叫备呢,意思就是我有一个主的数据中心,为它做了几个备份的数据中心,平时还是这个主的数据中心来工作,其他若干跟数据中心跟它形成一个备源的机制,这个数据中心如果出现问题了,不管说是内部问题还是说外部的连接问题,这个数据中心相关的业务就转到相应的备源数据中心来去继续承载。
其实如果从系统级来讲,我们传统叫双机热备,就是说有一台主的系统正在运行,旁边给你做另外一台备源系统,中间有一条心跳线去检测,如果这个主系统出现问题了马上切换到备系统去承载,平时这个数据是做同步的,能保证应用迅速就起来。
但是这不叫双活,不叫异地多活,叫双活是说两个系统全都是主的,你不分主次,两个数据的应用逻辑和数据的径向是完全一致的,等于说你把一个东西砍了另外一个东西是完整的,照样能运行,它是一个完整的,不像说主备之分,主要的应用全在主系统里面,备源其实只是做这种数据的同步,但是做数据同步以后如果这个系统宕掉了以后马上启这个系统,你要听明白是启,这个还有启的过程,还要把业务逻辑给它导过来在这个系统再启过来,所以支付宝这次的时间是一个很重要的点,它用了两个小时才切过来。
而且如果是双活系统理论上讲没有切不切的问题,就是从主切到备有一个切换的问题,如果是双活理论上讲是没有切不切的问题,切主要是在你上边的流量,以前通过你的流量管道到两个数据中心,承载的时候这两个流量分开是一样的,等于说我的一次请求是给这两个数据中心一块做的,一个数据中心宕了另外一个数据中心自然而然就是在那块,不是流量的问题,所以支付宝还解释说我们要导流量,这就可以确认说支付宝这套体系它不是一个双活的架构,如果说导流量在于说一开始我的流量就分散出去在不同的数据中心承载,有一个数据中心宕了,我要把它的流量导到其他的数据中心。
这就意味着说每一个数据中心它里边的数据都是不完整的,都是一个个一部分的,双活的概念是每个数据中心两个数据中心是完全一样的,这两个数据中心平时还都是一块工作的,都是活的,那个热备一个活的。
杨昀煦:一个植物人呢。
赵效民:对,属于待机状态,属于这样的,所以说在这个过程中你要说异地热备大家也就觉得合理,两个小时你能切换过去也算不错了,但是你叫异地多活一下大家就觉得你这水平不够,太次了,做容灾有几个指标,比如说有两个重要的指标,一个是RTO,一个是RPO,RTO的T是timn,时间,P是point,这两个意思是RTO是我业务恢复需要多长时间,RPO是我恢复到什么样的时间点,比如说我的数据只保存到昨天的,我要恢复我只能是恢复到昨天的,那个点就是我昨天的时间RPO,这次RTO用了两个小时,RPO有些客户就反映说我登录完了以后头像也没了,头像没了数据就是丢失了,但是它其实数据没有丢失,它后边还在慢慢做同步。
所以这个时候的P你都混乱了,你不知道这个point在哪,每个人恢复的时间点不一样。所以说这个弄完了以后我真不认为说如果以一个异地双活的标准,我不认为它是一个正确的算得上成功的多活的灾备。但是它如果叫异地多备我倒觉得可以理解,你花两个小时切换过去这也可以了,挺了不起的了,最后我觉得也给大家提个醒,做这种市场宣传的时候不要什么高大上的词都往上掰扯,我觉得很有可能会给自己埋雷的,本来其实很正常的一件事情,这事就被支付宝一宣传给搞复杂了,还自话自说。
我觉得从未来的角度来讲,双活也好,多活也好,这个活字真的不简单,你不是说什么样的一个级别都叫活的,按我们刚才所说的标准来讲,其实真正的双活数据中心它是各自独立完整的一个承载的体系,任何一个宕掉,用户的实际感受是没有任何感受的,没有故障感受。因为你从它的架构来讲,平时的访问就一分三,你的访问就复制出三份,同时访问这三个数据中心,你的数据写入也同时写入这三个数据中心,所以说平时你对它的应用感觉就是这样的感觉,它中间有一个数据中心宕了,或者数据中心光纤被人都切了,不管你是四根三根全被人切了那也没关系,另外几个数据中心照样能帮助你,因为数据都是同步的,数据都是一样的,业务逻辑都是一样的,那还要怎么样,所以说我觉得其实给我们一个很大的警示,就在于说追求容灾的极致是一个活,但是要追求这个活的过程中我们可能要付出极大的努力,有些人也说里边离不开运维团队人的因素,没有人去否定人的因素,但是越自动化越能解放出人的劳动力,前提你的自动化是靠谱的,其实你说你还去人工参与切不切这个我觉得并不是我们的终点,我们还是希望能够在一个极致的自动化环境里面以人工介入为辅助。
你说谁知道什么时候出故障,你也不可能24小时全盯着,如果说应急的故障当中有一个自动的应急机制保证业务连续,对你来说其实是好事,你在事后去做一些人工的微调,再做一个逻辑的调整,其实我觉得这是两全其美的事,互不冲突,所以说我觉得奔向更高的自动化容灾是一个必经之路。
杨昀煦:接下来支付宝可能就会把它的备走向活。
赵效民:它说是要做活,但是现在肯定还没达到这个标准。
杨昀煦:也希望社会责任这么大的企业还是要多考虑咱们用户的感受,好多小朋友都以为自己的工资没有了。
接下来我们说一下携程,携程也是我们平常用得比较多的网站,它刚开始说是自己遭受攻击,因为去年2014年3月刚过完年的时候它就已经遭受了用户信息泄露的这件事了,已经让大家人心慌慌了,结果它现在又出现了内部网站不能运行,APP也不能用,所以在您看来这个事件是什么样的事件,它之前说我们遭受了不明攻击,后来又把那条遭受不明攻击的微博删掉了,之后又说我们内部员工出的问题,您觉得事件是怎样的?
赵效民:我觉得其实从这一点来讲,它跟支付宝其实有一个共性,就是说很多时候我们一谈灾备,容灾,谈到都是对数据的保护,你的数据库要怎么样,数据没了你就完了,这话对,但是现在我们可以发现其实支付宝它做切换的时候也没丢数据,但是它是做应用的接口切换的时候花了很长时间。
携程这次开始说受到攻击,这其实是互联网公司业务受到影响的时候最常见的一种说辞,要不然就是DDOS,要不就是黑客怎么着的。后来发现其实这么高级别的大面积删除服务器代码的这种行为很难想象是一个黑客外部攻击,我相信以携程这么大的公司它的安全防护不可能那么烂,你现在真没有听说过一个网站能被一个黑客给删除的,后来又说是不是内部员工反水了,有网上八卦甚至说这个员工是级别比较高的,分赃不均,还有人说是跟老板抢女朋友怎么着,反正这个东西你没有一个明确说法之前,这种猜测你真的杜绝不了,后来发现其实实际是在代码更新的过程中人为操作错误,执行了全删除的命令,把服务器上应用代码全删掉了,把当时生产用的,我觉得没有明说但是根据他们的表述来讲,生产层的数据库也给删掉了,但是其实这个我觉得倒不用大惊小怪的意见,数据库本身,我觉得互联网公司或者传统企业肯定它有多个备份,实时的备份。
就是你在生产环境的数据库被误删了,旁边的数据库再给你导回来,问题在于说在你重建前台的业务逻辑时候是一个非常艰苦的逻辑,它不是一个简单的应用,比如说我们在PC上打开了一个软件,我打开一个看图软件,但是你不知道这个看图软件起作用的过程中它其实调用的操作系统很多的相关运行时,环境,库,可能都在里边呢,我们只看到了一个界面而已,其实在网站上也是一样,很多的时候应用之间它是有关联的,比如说你在携程上下一个订单,可能就有另外一个应用开始分析你的订单,开始写后边的库存表。
还有一个应用可能过来去看下订单的是谁,男的女的,多大岁数,他以前的订单是什么样,消费记录是什么样,有人开始给你做这种行为分析了。还有一些订单直接给它的合作伙伴,可能给它底下签约的供货商,相当于自动触发了。
如果说你把这些执行代码全删了,你要重新再部署的时候必须要把这个逻辑还要给保证过来,但是这有一点大家能发现,其实决定你一个企业连续性正常与否,前提其实是两个,一个是数据,你要数据正确一致,不丢失,另外就是业务逻辑,你业务逻辑没有了光有数据也是没用的,所以说这次它恢复的时间更长,它恢复了12个小时,据说有上千多个应用环境相互之间的辗转链接都要做好匹配,其实是很大的工作量。
所以说从这一点来说数据很快能恢复过来,但是业务逻辑就是一个很大的问题。所以说它跟支付宝两个在一起给我们一个很大的警示在于说,对应用的保护也是非常重要的,你说误删了东西也没办法,它不是外界的人为的限制,如果说就是一个黑客过来想去做这件事情,我估计它肯定有一些机制能抵御这种恶意删除,但是如果说是来自于管理员的命令系统不知道你是有意无意的,系统是很听话的,如果君要臣死臣不得不死,你发一个指令系统你自己格式化吧,系统只能执行,不能说管理员的命令你系统不听了,那就反了。
但是如果管理员是一个出了昏招了,这种事你只能说以更多的流程制度来去保障,这种特别关键的级别是不是两三个人一块执行,同样发指令才能做这件事情。还有遇到特别敏感的操作是不是要上报,程序要自动有一个上报的机制,你真要我死,这个臣要有一个申诉的机会。
所以我觉得从这一点来说给我们的警示还是蛮大的,以前我们更多看到的是这种物理故障,物理破坏,地震,水灾,电力,这种线缆的故障。其实我们更应该看重的是我们业务逻辑上的一种保障,这可能是给我们很多人一种新的课题,因为在互联网时代,在它的应用体系复杂性要比以前的传统企业高很多,刚才我说了你这样的一种互联的架构,里边这种应用体系的架构,面向不同服务体系的架构,错综复杂,它恢复起来其实估计比数据还要慢,数据如果说全没了,那你的公司就死定了,但是你业务逻辑迟迟建立不起来,对你的公司肯定也有非常大的影响,只是说可能一个更致命一些,一个稍微会让你吐点血,但是你血吐多了你也就致命了。
这就是我对这两件事情的总体看法,我不知道我分析完了你清楚了没有?
【34:00】ZDnet首届中国互联网+高峰论坛
杨昀煦:清楚了,而且我觉得这两件事确实对它们下的公共形象也有一定的影响,但是事情一出可能两家以后会再多完善,业界可能也会再思考自己的系统到底是不是这么完善。
另外,网上还调侃了有一个教训是老板一定要对IT方面的员工好一点,也是我们在互联网+时代下,这些东西没法避免的,除了问题我们及时解决,亡羊补牢,为时未晚,我们也希望以后能看到支付宝还有携程会越来越好。
另外,针对这些我们至顶网说到比较重要的一个预告,100期的时候预告一下我们至顶网将在电子学会主办的第七届云计算大会上面承办这么一个互联网+的论坛,您跟我们简单介绍一下这个论坛。
赵效民:互联网+的高峰论坛在6月4日下午,在国家会议中心,也是在第七届云计算大会期间来举行,这是由至顶网独家承办的。在此我简要介绍一下主要的内容,互联网+是我们国家未来科技发展的一个根基战略,都是围绕着互联网来去做加法,来去做你进一步的相关产业实力的增强。
我们这次选择的话题是跟制造业的结合,去探讨相关的一些理念,其中包括德国提出的工业4.0,美国提出的工业互联网,还有中国自己提出来的智能制造2025。所以说在这个论坛里面我们请到了相关的来自于中国还有德国政府相关机构的嘉宾,还有相关的一些企业代表来跟我们分享一下他们是怎么看待互联网跟工业结合之后所带给产业的变革。
所以说在此也欢迎大家关注我们的话题,能亲临我们的会场,而且我们最终要强调一点,我们有很多的大礼提供,具体什么礼品到时候大家关注我们ZDnet的微信号,我们就会做相关的介绍和推广。
杨昀煦:礼品对我们比较关注这方面的来说还是次要的,主要是有很多业界大咖都在这上面,制造业最近也是非常火热的领域,所以我们也希望大家能够关注我们。
赵效民:对,肯定挖断支付宝电缆,光纤,就是一个制造业的挖掘机,代表了我们中国制造业还是非常牛的,互联网你再怎么着你也抵不过我这一铲子。
杨昀煦:今天就到这里,非常感谢大家观看我们第100期,希望下次咱们再会。
赵效民:再见。
杨昀煦:谢谢各位。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者