Teradata张琦:在云中Teradata“无处不在” 原创

Teradata天睿公司云计算及服务专家、大中华区总监张琦表示,对于松散耦合的数据往往是最会发生创新的地方;无耦合的数据就像是还没有初步筛选过的矿石;紧密耦合的数据就像是已经精炼过的矿石;松散耦合的很有可能当中找到宝。

至顶网CIO与应用频道 06月15日 北京消息:2017年6月14-16日,中国电子学会主办、至顶网等协办的“第九届中国云计算大会”在北京国家会议中心拉开大幕,本届大会主题为“生态构建 深化应用”。

Teradata天睿公司云计算及服务专家、大中华区总监张琦表示,对于松散耦合的数据往往是最会发生创新的地方;无耦合的数据就像是还没有初步筛选过的矿石;紧密耦合的数据就像是已经精炼过的矿石;松散耦合的很有可能当中找到宝。

Teradata张琦:在云中Teradata“无处不在”

Teradata天睿公司云计算及服务专家、大中华区总监张琦

以下为演讲实录

我们过去的商业模式,数据是商业运营的结果,今天商业是运用数据的结果。变化非常的巨大,真正的领导者至内而外引发行动,他们坚定的相信数据和分析才是今天商业社会真正的能源、真正的石油。我们坚信数据和深度分析才会释放伟大公司的所有潜力。

我们需要提升客户体验,在今天的竞争当中所有的公司都希望能够获得优势,获得新的竞争优势,他们需要去重塑客户体验流程。作为消费者我想在座的每一位都一样,我们希望获得是独一无二的用户体验。比如走进银行我希望我们的客户经理能够了解我,能够给我推荐的东西是我需要的。提供的服务是适合我的;我们进入一个网站我不希望看到千篇一律的产品,或者是完全不适合我的东西。当我的设备在运行的时候,我希望我的服务商能够提前预警告诉我什么时候可以出现问题,而不是事后来补救。这一切就需要大数据和深入的分析所提供的洞察力来了解客户。更重要的是要利用这些洞察力,在适当的时间、适当的地点,用适当的渠道跟客户发生正确的沟通,否则的话基本上会让客户觉得是非常不好的体验。

同样,今天的企业需要创新,所有产品的创新需要不停的实验,实验需要的不是灵光一现,需要的是数据,需要的是分析。美国领先的视频点播厂商Netflix,它每年会在它的产品上经过超过一千次以上的实验,它曾经悬赏一百万美金要求让全世界各地的数据分析师参与,帮他们提升数据推荐引擎的成功率。事实上据我了解还有很多来自中国的数据科学家、工程师参与了这一次竞争。最终通过大家的努力,数据推荐引擎的效率提升了10%,这其实是一个了不起的成果。事实上每一个伟大的科技公司,都在做同样的事情,谷歌也在做、亚马逊也在做,苹果也在做,这一切都离不开数据离不开分析。

今天大数据和深度的分析已经彻底的改变了商业的版图和商业的模式,他们不断能够增进主业的竞争力,甚至还再创造出全新的商业模式。我们Teradata不断总结国内外成功经验、整合成熟的解决方案到分析框架当中。 以混合云平台支撑能力、客户实施服务、专业咨询为三大主轴,支持各行业客户、各类大数据分析需求的规划和建设。我们以目前业界最灵活、最开放、最全面的大数据解决方案,协助客户高效实现业务提升的价值。

我们来谈谈数据,通用公司的CEO曾经有一次讲过,一架飞机从纽约飞到芝加哥,它的发动机所产生的数据超过1TB,包括温度、耗油量、磨损等等。同样我们中国令人自豪的航天计划,像嫦娥神州等等航天计划,一个中等规模的航天器至少超过两万个物理量需要实时测量,神州飞船在天上载轨飞行两到三年,那是多么大的数据。

我们有大量的数据怎么去用它们呢?实际上大数据的分析最难的地方是找出哪一些数据有用,把有用的数据用起来,这其实往往是难点。我们往往可以把数据做一些简单的分类,比如说有一些数据它明显具有很强的商业价值,它跟其他的数据相互关联、相互耦合,并且被业务用户频繁、反复的使用,我们称它是紧密耦合的数据。一般用比较技术的语言来讲,很多时候它是结构化的数据,它有对数据质量有要求,对数据完整性有要求。

另一个极端是一些所谓的无耦合的数据。什么叫无耦合的数据?不是这些数据不重要或者是错误的,它只是相对孤立,暂时还没有和其他的数据结合起来产生更多的洞察力。这样的数据类型当然很多,比如某些监控数据有时候只是一些无耦合的数据记录。

介于中间还有一些松散耦合的数据。很显然所有这些数据的价值是不一样的,至少价值密度是不一样的。

紧密耦合的数据用的很多,已经做了充分的发掘,显然具有很深的业务价值,我们每天都在用它,是我们企业运营的不可或缺的基础数据。一些无耦合的数据可能往往数据的价值密度没有那么高。不同的数据使用的程度当然也不一样。怎么去保管它们,怎么去使用它们?所需要采用的平台和技术都是不同的。简单来讲,对于无耦合的数据,我们怎么做呢?我们的策略一般来讲我们需要把它们都存下来,我们不知道什么时候会有用,这些数据有一天就是金子,我们希望用最便宜的方式把这一些数据存储下来,让我们的数据科学家,让我们的工程师可以去探索它们,有一天它们也许就是有价值的数据。

对于松散耦合的数据往往是最会发生创新的地方,无耦合的数据就像是还没有初步筛选过的矿石,紧密耦合的数据就像是已经精炼过的矿石,松散耦合的很有可能当中找到宝。所以我们往往把这些数据需要让我们的数据科学家或者我们的业务专家去分析,那提供什么样的方式给他们分析呢?我们要给他们最方便的分析手段,所以我们一般提供他们一种高级的分析平台、探索平台。

当然了大家都很清楚紧密耦合的数据,就像我们企业里每天使用的各种报表,比如财务报表、质量报表、业务报表等,每天都不能少。它是我们企业经营重要保障。当然它的可用性要求就很高,它对时效性要求也很高,所以一般来讲我们往往会采用一些高可靠的、高性能的这种平台和工具去处理这一些数据。

不同的数据分类实际上并不是一成不变的。就像原来是一些无耦合的数据,可能通过我们的数据科学家的探索,发现我可以找到与其他数据的相关关系,说不定这一些新的洞察力就是战胜你的竞争对手致命的一击。那这时候我们就可能需要把这一些貌似无耦合的数据迁移到高级分析的平台上。另外一种就是像我每天都在用的一些已经紧密耦合的数据,它们当然很有价值,它们是所谓的热数据,可是随着时间的推移热数据也会变冷。一旦热数据慢慢变冷以后,基于成本的考量,事实上我们也要把它迁移到相对廉价的其他的平台上去。

今天的新技术和平台发展非常之快,无论是公有云、私有云还是混合云,还是本地的解决方案都非常多。但是我想说的是,到今天为止没有一种单独的平台和技术可以解决所有的数据分析的问题。

随便举一个例子,公有云很灵活、伸缩性很强,但是我想很多客户对数据的安全性,隐私会有担忧。私有云具有一定的灵活性,也能够通过把数据保留在企业内部解决了部分对数据安全的担忧,但是对于一个中等规模的企业来讲,自己构建私有云和运维私有云事实上成本不低。我想并不是所有的负载都适合云,比如说需要极高性能,极高可用性的分析事实上今天的云无论是公有云、私有云还不能完全的解决,可能还需要我们一些本地的解决方案。这一些方案也许性能很好,可是它是专用的,灵活性又是问题,所以没有一个办法可以解决所有的问题。这世界不是因为我们只有一把锤子,而所有的问题就都是钉子,它们的确不是钉子。

所以在今天在我们看来,对于我们的企业来讲其实需要的是部署的灵活性。我们要在公有云,私有云,和本地部署当中选择最合适最有效的方式来进行数据分析和商业洞察。不仅仅是简单把数据和分析分布到不同的平台上去。这很容易回到最初的数据完全分散的原始年代,我们所推荐是的不同的平台分布是是物理上分散,在逻辑上还是要整合,并不是把数据分出去就行,逻辑上是要整合的,给用户的体验是要整合的,这个是很多厂商或者很多专家可能会忽略的地方。

根据2017年的调查,预计到2020年差不多90%以上的企业会选择在云端和本地都部署自己的IT系统。没有一家企业今天说我会到2020年丝毫不用去考虑任何云的部署,也很少有企业,尤其是规模比较大的企业,可以说我百分之百完完全全部署在云上。所以混合云的部署应该来讲是一个大的方向,这是毋庸置疑的。

另外一个明显趋势是至少有85%的企业不希望再把所有的资源投入到相对繁琐的IT基础架构的购置、安装和运维上去。这当然需要很多的技能、花费很多的金钱。很多时候说他们会说我希望把我的精力是不是放到我的业务专长上去,放到数据分析上去。所以这种平台即服务越来越被我们的用户所接受,我们所看到85%的客户愿意接受分析即服务、平台即服务。

Teradata本身是作为业界最高性能的数据仓库和大数据分析平台,今天全面支持在公有云、私有云以及本地机部署。同时我们也支持向客户提供分析托管云。我们认为最重要的是可以让用户自由的去选择,所以Teradata在所有的平台上提供的工具,软件是一致的。

对客户来讲我原有的应用、数据模型,甚至是数据、工具都是可以无缝的迁移,随便举一个例子,在一些软件项目刚刚起来的时候,需要大量的人员去做开发、测试。那我们可以在私有云上、公有云迅速的部署环境进行开发测试,因为我们所有的软件和工具都是一致,开发完成以后直接无缝的迁移到其他平台上。

只是把数据应用分布到不同的平台上其实只是第一步,最重要我们要提供用户自由地在各个平台之间,逻辑上统一的数据访问。所以我们提出我们要做无边界分析,简单来讲我们的数据也许分布在不同的平台上,有公有云私有云甚至多个云和本地,我们可以通过某一个平台可以访问所有的数据。

Teradata提供在所有的云平台之间可以自由迁移的软件许可。在目前的混合云厂商当中应该是第一家,可以方便用户不会被锁定在某一个平台上,软件许可可以在不同平台上自由的迁移。你想要灵活性和伸缩性的时候可以使用云,当你需要高性能和安全性的时候,也可以将软件许可转移到本地平台上。

我这边想举几个基于Teradata的这种混合云架构的一些应用的案例。很多时候我们希望把数据、应用分布在不同的平台上去。刚才我讲过什么时候大家会选择本地机,事实上一定会有这样的需求,比如说我们像这一些需要高可用的系统,比如说类似于银行的核心系统,类似于一些业务单位的4个9的系统,今天的云还是达不到这样的要求,我们需要本地的平台去交付。

有的时候本地部署的系统的伸缩性不够高,比如碰到月末、季末我们的财务需要做很多的分析, 这时候系统的资源就会不足。比如说一些初创公司或初创的业务,我们当然希望他们业务能够出现爆涨,然而IT却没有那么强的伸缩性,这种时候我们需要云。我们推荐用本地解决本地的问题,云去解决云的问题,无论是公有云还是私有云,利用无边界的分析方式把这一些数据统一起来,这样数据可以随时迁移,负载可以随时迁移,这样对用户来讲带来的是灵活性,同时保证了性能,还有本地部署的安全性,更重要的一点,云的这种伸缩性和按需付费,可以让我们的用户在成本上是可以得到优化的。

今天利用数据实验室,或者数据沙盒,已经是整个业界的常态,如果有哪位你所在的公司说我们还没有做这样的事情,一定要回去推荐给您的领导:我们要用数据去做实验。在使用数据实验室的时候,业务单位、数据科学家往往会抱怨,我拿到的数据往往都不是最新的,我拿到数据可能都不知道什么时候的,甚至是假数据,那我怎么去做实验?业务单位做数据实验的时候需要平台资源,往往跟IT部门申请要很久才能满足。或者有的时候经常从生产系统下载最新的数据,也会对生产系统造成一些冲击。

我认为使用云就很好解决这个问题,我们可以让用户自助生成数据实验室和数据沙盒,另外我们也不希望把生产的数据,往往是海量的数据拷贝到一个新的平台上去,我们希望是能够穿透到不同的平台去访问它,不用去拷贝数据。但是如果你个人有一些新的想法,新的数据也可以加载进来,跟原有的数据进行联合分析。这样的模式对原有的生产环境不会有业务的冲突,这样可以保证既有创新又不会影响生产环境。

今天所有的企业都意识到数据的重要性,所以灾备系统成了企业架构中必不可少的部分。今天我们用云可能更加灵活,比如说我们可以在云上部署灾备系统,在平时可以用很少的资源,但是出现真正灾难时,我们可以迅速的扩充系统资源使灾备系统迅速的运转起来,在有一些场合下我们甚至可以利用公有云廉价的存储做到成本非常低的灾备系统。

今天其实已经有非常多的客户在用这种混合云的概念和产品来设计大数据分析平台,比如说以耐克为例,耐克在它的本地部署了核心的Teradata分析系统。因为有一些数据需要高性能的深度的分析,有一些数据它有安全性能考虑,所以部署在本地。考虑到灵活性,耐克也利用Teradata在亚马逊的公有云上部署了一些临时的应用。另外它还利用了亚马逊的廉价的对象存储存了大量的数据。不同的平台干不同的事情,一旦碰到业务爆涨的时候,利有云可以迅速的伸缩性扩充。更重要的一点是通过本地的分析平台,直接可以去访问公有云上的数据,不是简单访问,而是把数据拿过来直接跟本地数据进行关联和分析,这给用户在使用上非常一致的体验,混合云的总体成本上又是可控的,我们觉得非常高兴可以帮客户做到这一点。

回过头来我还想讲,今天的数据和分析,已经成为每一个企业的主业,而不是副业。我们相信没有一个平台在今天可以解决所有的数据和分析问题,我相信我们Teradata提供的这种混合云的架构、公有云、私有云、本地部署以及提供的这种分析即服务的托管云IntelliCloud,可以给我们的客户带来更好的灵活性、安全性,以及成本的优化。我们Teradata是扎根中国,希望跟中国所有的客户,以及我们的合作伙伴生态构建、深化应用。

谢谢大家。

来源:至顶网CIO与应用频道

0赞

好文章,需要你的鼓励

2017

06/15

15:11

分享

点赞

邮件订阅
白皮书