科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网CIO与应用频道百度陈尚义:让百度串起社会民生的节点

百度陈尚义:让百度串起社会民生的节点

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

百度技术委员会理事长陈尚义在第五届云计算大会期间接受ZDnet独家访谈时表示,从业务上来看百度天生就是云计算与大数据的公司,而现在面临的挑战包括数据量大、数据增长速度快以及数据中心能耗问题。大数据对于百度来说,是提高用户搜索体验的重要工具。

作者:陈尚义 来源:ZDNet CIO与应用频道【原创】 2013年6月25日

关键字: 第五届中国云计算大会 厂商视点 百度 云计算 大数据 IT名人堂

  • 评论
  • 分享微博
  • 分享邮件

ZDNET至顶网CIO与应用频道 06月25日 视频采访:百度技术委员会理事长陈尚义在第五届云计算大会期间接受ZDnet独家访谈时表示,从业务上来看百度天生就是云计算与大数据的公司,而现在面临的挑战包括数据量大、数据增长速度快以及数据中心能耗问题。大数据对于百度来说,是提高用户搜索体验的重要工具。百度未来的发展方向在于数据的整合能力,也就是由由过去的用户按照同一问题的不同方面分别进行多次搜索,转向一次搜索就将相关问题以及用户可能会感兴趣的信息都推送给用户。

以下是ZDNet记者对百度技术委员会理事长陈尚义的访谈摘要:

ZDNet:各位网友大家好,欢迎大家再次收看我们的第五届中国云计算大会的现场采访,今天现在我们邀请到的嘉宾是百度技术委员会理事长陈尚义先生。

陈尚义:您好。

大数据是提升用户体验的工具

ZDNet:非常感谢您能接受我们的采访,那么我们也知道百度是在中国IT领域,是非常知名的一个公司,可能很多我们的这种网民,日常的生活中肯定都离不开百度,那么百度今天作为一个第五届中国云计算大会的一个重量级的一个嘉宾,我想问问陈先生,在百度眼中云计算、大数据意味着什么,它的价值是什么。

陈尚义:我首先想说,对于百度来说,它是一个天生的云计算,或者是大数据的公司,为什么这样讲呢,因为做搜索的公司,从一开始就要抓取全网的数据、网页,然后我们内部对于它进行分类索引,然后供网民查询、展现结果,那么大家都知道,网页的数据是海量的,那么所以说百度从一开始,它就是一个大数据的公司。同时呢,它也一开始就是一个云计算的公司,因为一开始就像把这些数据进行存储、处理,那么随着数据规模的急剧的膨胀,那么后台的存储量、服务器的数量也急剧的膨胀,那么如何来把这些服务器有效的组织起来,形成一个资源池来供百度统一的调度和高效的利用,那这是我们是一开始就要,就是说到现在为止,长期要解决的问题,刚才我讲了哪些把服务器各种的资源,给它统一起来形成资源池,然后统一调度,弹性的分配,那么这就是后台的云计算最关键的应用,所以我们以前也讲过,搜索引擎它是云计算的一个应用,一个典型的应用,道理就在这里。

ZDNet:对,没错,其实搜索引擎本身其实就是一个云,每个人其实在网上去做搜索的时候,你自己不用建立一个搜索引擎,其实你是借助于百度的搜索的服务来获取你想要的一个内容,其实有很多的时候,从国际上来讲,很多这种云、大数据领先的这种企业,其实都是互联网企业,那么我们也看到美国的谷歌,就是一个非常知名的例子,那么我们也相信,百度其实在这方面也是类似的,那么您如何看待就是说,百度在云计算和大数据这两个领域当中的自身的一个定位,刚才你谈到是云和大数据在百度自身的一种基因的一种体现,那么百度的诞生起来就是一个云和大数据的公司。那么现在我们放在这两个大的领域里,您如何看待百度在中国的云计算和大数据市场当中的一个自身的定位?

陈尚义:我想讲的是,互联网经过10多年的发展,可以说从无到有到现在的规模相当的庞大,现在网民有5、6亿,是世界上任何一个国家无法和中国相比的,那么在这种情况下来讲的话,就是我们面临着诸多的挑战,这个挑战在哪些方面呢,有量大的问题,刚才我讲大数据,还有一个效率的问题,由于它每年增长非常快,增长快到什么程度,大概是每年翻一番的这种进展和发展,这种发展的话就意味着我们很多事情,我们的基础架构,我们的服务器的数量,必须得适应这种发展,让它有可扩展性,让我们每新增加的一个功能或者新增加的一个模块,必须要及时的交付,否则的话你满足不了这种高速的成长性。所以在这种情况下,我们无论是在基础架构方面,数据的存储方面,服务器的交互效率方面,我们都是说做了别人没有做过的事情,也许说那些互联网的巨头他们积累了一定的经验,但是这个它是绝对不可能跟我们去分享,也没有时间跟我们去分享,他们忙自己的事情还忙不来呢,那么所有的这些问题就靠我们自己去解决。另外还有比如数据中心的节能降耗的问题,商业公司在出于成本的考虑,它必须得在面临大量服务器增加、大用电的情况下,还要占地方,所以必须得想办法,让它占地方小,让它省电,让它部署效率高,那么在这一方面我们也是自己想了很多的办法,包括在展台里面你们也看见了,这个服务器的定制,我们想办法捣鼓一下用ARM芯片做自己的服务器,目的是什么,让它体积小、省电,在这方面我们积累了很多这种东西,

这个讲的是在云计算方面,所以说我的结论是什么,百度这样体量的互联网公司,在云计算方面绝对是一个先驱者,它在不断的探路,做了前人没有做过的事情。在大数据方面,也是一样的,百度对于大数据来讲,对于我们的重要作用是提高用户的搜索体验,这个是我们最主要的目的,所以我们从一开始就分析用户的数据,那么分析我们的数据,然后就是让我们的搜索结果,还有排序更能够满足用户的需求,这是我们在大数据方面。那么从大数据量的方面来讲,我们处理的量每天现在能达到100PB左右,我们积累的数据量有1000PB,那么现在我们的存储的能力将近2000PB,那么在这一方面,其实我们也在很多的探索,特别是在基础架构的基础方面,我们在不断的探索,同时我们也是利用这些数据分析完了之后,供我们的客户,就是那些中小企业在百度上做推广,俗话就叫广告,这样一些东西,那么从这个意义上讲,就是我们又是在帮助这些中小企业,让他们的产品和服务找到客户,促进了这个产业链的这种生态的发展,所以应该说大数据方面,我认为百度起到两个作用,一个是在技术方面像云计算一样不断的往前探索,做了一些别人没有做过的事情。那么在商业方面,我们帮助了一些中小企业,让他们更精准的投放广告,别浪费冤枉钱,我想这两个。

百度利用开放平台为开发者提供便利

ZDNet:那么今天也看到了,其实百度的副总(范丽)女士那么今天也在大会上做了主题演讲,跟您刚才说的一样,我也感觉到在这种云和大数据相关的技术研发方面,百度是走在前面的,您刚才说的这种,第一个这种采用ARM的存储服务器,还有这种定制的机柜的服务器,那么给我们感觉说,百度的确是在这种技术研发领域来讲,已经走在我们国内的前面,这是从技术角度讲,还有另外一个角度,就是说您刚才也谈到了,就是说百度自身的这种IT的建设,我们有很大的这种数据中心,很强的数据的处理能力,还有很大的资源的共享管理能力,这是我可以认为是百度内部的自有云,私有云的一种形态,现在其实很多时候,在中国市场上,很多大家还在关心的一种云叫公有云,我们也看到很多国内的企业都在提供相应的公有云的服务。

其实百度也在做这方面的事情,那么我们也知道,耳熟能详的百度云,就是百度在这公有云方面的一种努力,但是似乎给人感觉百度在公有云的方面好像并不像我们平时听到像阿里云,盛大这方面涉及到层面比较广,那么可能更多的是在SaaS这一层和存储这一方面来做一些事情,那么百度在公有云方面的理念,和发展战略又是什么样的呢?

陈尚义:这个我很乐意跟大家一起分享百度在公有云方面所做的一些努力或者取得的一些成果。首先我想说一下,就是百度原来的基础架构的能力,就是这个云服务的能力,大家都说这是私有云范畴的,其实我们更愿意讲它是一种专有云,我们是做搜索引擎的,专用的搜索引擎,然后给大家在提供这种共享的开放式的服务搜索引擎。

其实百度在现在大家说的公有云的领域里头做了很多的工作,不知道赵总您知道不知道,百度有一个百度云盘,这就是典型的云存储,还有百度相册,类似于这样的一些东西。对,那所有的互联网公司,做到一定规模的时候,它有同样的一个事情可以做,就是把能力开放出去,给全社会,那么百度也是一样,因为这个事情大概是这样的,就是过去我们做搜索引擎这件事情的时候,我们就是有一个平台,那后来我们开发了很多的产品,大家都知道除了百度搜索引擎之外,还有百度百科、百度知道、百度地图好多,那么这加起来有好几十个,那么百度自身研发的,自己内部用的产品,还有一些过去的产品还没有上线的,就更多了,那么所有的这些产品用的是一个平台。

后来想到这个平台实际上可以开放出去让社会上的开发者,也可以像百度这个开发的团队一样,在这个平台上开发他自己的应用,特别是在移动云计算的这个年代,因为移动云计算的这个应用这是五花八门、五彩缤纷,没有哪一个公司,可以满足所有的移动的网民的这样的一个需求,那么所以就是我在想高手在民间,他真正知道用户的需求在哪里,他散布在社会的各个角落、各个层次,那么我们把平台开发出来,让他们有积极性去开发这个应用,我们给他提供开发的平台、提供调试的平台、提供运营的平台,甚至我们还帮助他怎么去找到用户,怎么利用百度的这种商业模式去挣到钱。然后我们后面有很多的统计数据,让他开发的这个应用,就是更加精准的满足用户的需求,

我们开放的战略就是把我们积累下来的这10多年积累下来的这种能力,各方面的能力,除了技术的之外,有找到用户的能力,有赚到钱的能力,还有用数据帮助你提高用户体验,找到用户的需求这样的能力,全部开放出去,所以在去年的9月3号,我们每年百度都有一次百度事业大会,去年的9月3号我们的事业大会上就是跟开发者进行沟通,我们提供了七种武器,这七种武器都是帮助开发者,其中我给你举一个例子进,我们有一个MTC,MTC是(Mobil Testing Center),就是移动的测试中心,这么一个东西。那么为了帮助开发者,我们在云上做了一个测试的环境,让开发者把它的应用交到我们的测试环境里面来跑一下,那么很快给你形成一个报告返回给你,建议哪个地方要改,或者哪个地方跑不通,那么这个对于开发者来讲,这是非常的好的事情,如果没有这个云的测试环境的话,他要买各种各样的手机。

ZDNet:他要自己搭建。

陈尚义:手机现在出来的频率太高,他买不起,就是一个小的团队来讲这是一个巨大的负担,所以我们有这个事情是做了很多这样的事情,除了MTC之外我们还有其他的六种武器,很多很多。在大数据方面也是一样,比如说我们在语音识别,在地图这方面,这实际上就是大数据的应用,这个大家广大的网友可能都知道,我们把这个能力打包出来,然后开发一个API,给社会上的开发者,哪怕你是一个个体的开发者,你会调用我的API,那你就站在百度的巨人肩上,你再开发的应用,哪怕功能再简单,但是有跟人说话的能力,因为百度有云识别跟语言理解这种能力,然后你也可以站在百度的肩上,用百度的地图,地图给你画好了,还有很多数据都画好了,你可以用百度的地图,是在你的应用可以嫁接在这个上面,总而言之百度开放这个平台的目的,是为了促进广大开发者,激发他们的积极性,满足用户的需求,从而使整个的生态圈能够得以繁荣,百度也相信,只有生态圈繁荣了之后,百度的发展才会更大,所以刚才您问的这个问题,我不知道有没有回答您的问题。

百度优势在于基础架构层面

ZDNet:我觉得很好,其实让我想到了一个,就是非常类似的一个案例,我们知道亚马逊,亚马逊它很知知名的云服务,AWS其实就是起始于亚马逊自身的IT的系统,那么它的IT平台觉得,我这已经很足够了,那我是不是可以把它开放出来,但是我们也知道AWS它一开始起步是IAS平台,那就是说基础设施即服务,那么我们也知道公有云分三个类别,有Saas的、有Pass的,有基础设施即服务,有三种,那么您能帮我就是说根据这三类你来总结一下,百度的这个公有云的这些战略,我们现在已经进入到哪些领域,还有哪些领域我们即将进入?

陈尚义:这个是这样的,就是说IaaS也好,PaaS也好,SaaS也好,这个是作为研究云计算的时候它的一个概念,我们做事情一般都是比较实际的,所以说我们很少套这些概念,但就是说你要愣套的话也可以,比方说我们的存储,显然是一种基础设施,所以刚才我说百度的云盘、相册,还有我们讲的一个概念叫个人云存储,PCS,那这个它都是属于存储、基础设施IaaS这一个层面的。

刚才我讲的这个平台,面向开发者的,我是一个平台,你在我上面开发、调试,然后我给你运营,这是一个典型的PaaS,

然后SaaS呢,比如说你开发的应用,你是一个开发者,开发的应用在我上面跑,软件在我这上面,然后用户用你的软件的时候,他只是享受到你的服务,并没有得到你软件的拷贝,也没有花钱买你的软件的license,所以他只是享受到你的服务,百度的平台都是免费的,所以没有计费的模式,计的话也可以,我们可以很小力度的去计,但是我们现在没有计,但是我们内部是计的,你的产品,你的百度地图,你占用了百度多少资源,占用了多少存储,这个是有记帐的。

那么这个是属于,刚才说的开发者,包括百度的一些应用,在这个平台上跑的,用户享受到的、看到的是一些服务,这个就相当于SaaS这一层。

这是百度在IaaS、PaaS、SaaS这方面各方面的分类大概是这样。我想提供什么样的服务,还是觉得我想有几个因素,第一个是基于它自己的特长,还有一个基于它自己的判断,他觉得这个有前景。

ZDNet:那您觉得百度的特长是什么。

陈尚义:百度的特长应该是基础技术方面的,基础架构方面的,开发方面的,对,不知道你有没有发现,百度技术方面的积累还是挺深厚的,搜索它的一个最核心的东西就是一个算法,这是我们老板在上世纪90年代发明的一个超链分析的专利,中国人都不知道,中国人发明了一个叫超链分析,这个专利实际上是比那个还要早好几年,他发明这个专利的时候,是参考了我们老板发明的这个专利,所以后来呢,就是中国人知道了这件事情还是从美国国家资源科学基金副主任,一个老先生在去年的计算机发展大会上,他就唯一的提到了一个中国人就是李彦宏,他说中国人李彦宏发明了一个超链分析早于谷歌,这个发明他说不得了,这个堪比TCP IP的协议的发明,那所以说,我想讲这个意思,但是后来中国人知道,中国科学院,工程院的院士李国杰先生他知道这个消息之后,他说这是中国人的自豪,这个可以载入历史的史册。

我想说明的什么意思,就是搜索引擎的基础是很难的技术,那么随着后来人们对于搜索引擎的需求不断提高,高到什么地方,我给你随便打一个比方,原来过去我们其实有IT背景的人才用搜索引擎,用计算机打开搜索引擎,然后里头进入那些关键子都是比较规范的,我们要想一想,什么样的关键字才能找到我们的内容,但是现在包括我们自己在内,包括我们自己IT背景的人在内,就是我们连想都不想,有什么问题直接就是在那个框里头去打,比如说我到国家会议中心就是这,怎么走,就是一个资源语言这么表达,特别是在手机上对他喊话的时候,不可能喊一个关健词出来,就直接问我到国家会议中心怎么走,或者说第五届云计算大会在哪里,或者是说ZDNet老板是谁,就是这么问,这是很正常的,所以这个句子也越来越长,那就需要我们理解用户到底要干什么,关健词是机械的跟后边匹配就行了,那我们要理解你到底要干什么。然后这个首先就是说资源语言的处理和理解,刚才我说的对着PC、对着手机喊的时候还有一个语音识别,然后后台就要整合这些数据交给你,因为你要求东西,我传数据交给你,过去简单,我就把那些相关的链接一个一个给你列好了,但是现在不是了,现在今天不是咱们要讲大数据,现在我们把后台的数据要整合起来,比方说我想搜一个人,比方说搜至顶网,至顶网我不是说仅仅想知道至顶网相关的链接,我可能需要知道至顶网相关的信息,至顶网是干什么的,在哪个位置,老板是谁,核心的业务是什么,那么我把后台的数据都出展现出来,就是放再一个比较形象的画面上,这样的话用户一看见我搜至顶网,所有信息都看见了,那么这后台发生了那么多的变化。所以说未来的话,就是百度在技术上的投入,我相信还会加大。

今年的1月19号,就是百度的每年的年会,我们老板在那里头宣布,第一个百度历史上第一个研究院成立了,要招募世界上最优秀的人才,要成为世界一流的研究院,也可以看得出来百度在技术研发方面的投入,还是有很大的决心。

那么我们这个研究院主要是做一件事情,叫深度学习,这个大家可能很少听说过这个词,深度学习,深度学习说白了就是什么,就是模拟人的大脑的神经原结构,去实现人工智能,进行数据挖掘那么一个东西,所以你要问到百度的特长是什么,我作为技术部出身的我特别乐意谈这个话题,百度的特长,在技术的积累方面。

ZDNet:还有在技术的整合方面。

陈尚义:技术的整合方面。

ZDNet:我觉得还是有一个非常生动的例子,比如我说我去国家会议中心怎么走,它肯定还会要结合你当时的地理位置,你的位置的这种数据,再结合起来相互再一分析。

陈尚义:还有实时交通的数据。

未来将提升数据整合能力

ZDNet:没错,那举到这个例子,让我想起今天范总主题演讲的时候,他后边举了一块看似好像跟百度现在关系别不是很大的一些未来的服务的前景,包括医疗、交通、社区的这些服务,这代表了百度未来的一种关注的方向,还是说它未来的一种发展趋势吗?

陈尚义:说百度关注的方向是一点都没有错,因为什么呢,互联网通过这10多年的发展,应该是说积累了很多很宝贵的东西,这些宝贵的东西,包括哪些,包括刚才我讲的在一种极速发展的过程当中,它的效率,它的能力,还有它做了很多别人没有做过的事情,就是说积累了很多这样的东西,包括它的理念、它的人才的重视的程度,那么所有的这些东西加起来用到传统的行业里头去的话,它一样能够解决很大的问题,比方说当电子商务对传统零售业进行冲击的时候,那么它带来了很多的变革,带来了比方说物流业的变革,人们的消费观念的变革,那么同样的就是说互联网用到其他行业,用到教育方面的话,那么使得教育更加平等,使得我们每个人更加容易接收到比较优良的教育资源。

那么用到医疗方面,我们充分的把民间的医疗能够激活的话,我们大大的缓解就医难的问题,实际上现在目前我们已经做了很多这样的事情,刚才您讲的数据的整合,比方说过去我搜一个颈椎病,我不是医生,我不是没事干跑去搜一个颈椎病是怎么回事,一定后面还有别的东西,或者说我有颈椎病,或者家里有人有颈椎病,或者我怀疑自己有颈椎病我去看看有那些哪些成因,背后的原因是什么,以及就是它有哪些医院,或者有哪些医生,那么过去的搜索引擎就是一条一条去搜,搜完颈椎病之后去找原因,找完原因之后看看有哪些医院,然后我再退出搜索引擎,再进入搜索引擎看看有哪些医生可以治。现在不是了,范总做了一件事情,就是把这些数据进行整合,一下子推送给你,你查颈椎病的时候,相关的问题都推送给你,知道你可能对这些东西感兴趣。

ZDNet:就是以后一查颈椎病,就直接给你挂号了,你想挂哪个医院的。

陈尚义:甚至连交费都可以在网上直接进行了,还要告诉你路怎么走。这就是说这样的一些数据的整合,牵扯到很多的技术。这个话说回来,医疗、卫生、教育、交通这些和老百姓息息相关的这些东西,实际上是早晚有一天他会借用互联网的力量,去促使它得到更快的发展。这个是老百姓的刚性的需求,所以是早晚的事,所以百度比较关注,希望它能够早一点能够解决老百姓的这种实际问题。

ZDNet:是,这个我觉得给我一个启发,我不知道您同意不同意,以前我们就是说一个人你不要,视角要宽阔,你不要以点概面,但是我现在看到这个云,尤其像说百度现在这种愿景,给我们感觉它是一个以点带面,就是说它能把你通过一个点能带出一个纵面出来,我们也知道就像您刚才所举的例子,说我颈椎病,那么从开始发现有征兆,但我去看到底有什么样的能治愈的方法,去选医院、找大夫、挂号、住院,他是一条面,一条面的时候,它分好几个点,可能通过百度的这种结合和串联,其实它是通过其中一个点,就能把这个面给你带出来,那么我觉得这是做数据整合和做这种云的整合,这个我觉得是一个非常好的愿景。

那么非常感谢陈先生今天作客我们的采访,我们也希望,百度能成为我们刚才说那颗,就是我把这个点都串成珍珠的话,那么它是很好的工匠,能把这些珍珠能串起来一个非常好看的项链,那么让我们的生活变得更美好,而不仅仅是一个搜索引擎这样一个公司,那么我觉得搜索引擎是能让我们去找这个点,那么我们希望能找到后边那个项链,那么希望百度能给我们带来这样一个美好的未来,谢谢陈先生,今天参加我们的采访。

嘉宾:谢谢,我也想通过百度的努力,能够更多的满足老百姓的这种刚性的需求,像刚才说的教育、医疗,从而实现老百姓的这种美好生活的梦想,从而也实现为中国梦的实现添砖加瓦,谢谢您。

ZDNet:谢谢。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章