科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网CIO与应用频道七牛志在成为最开放、最完备的数据服务提供商

七牛志在成为最开放、最完备的数据服务提供商

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

8月29日,七牛D-Future大会上,CEO许式伟带来主题为《数据启动商业新常态》的开幕演讲。他从互联网对企业商业形态带来的影响讲起,强调了数据在其中所起到的重要作用,并直指非结构化数据和日志数据两大数据“金矿”的价值,远未被人们挖掘。

来源:比特网 2015年9月8日

关键字: 七牛

  • 评论
  • 分享微博
  • 分享邮件

8月29日,七牛D-Future大会上,CEO许式伟带来主题为《数据启动商业新常态》的开幕演讲。他从互联网企业商业形态带来的影响讲起,强调了数据在其中所起到的重要作用,并直指非结构化数据和日志数据两大数据“金矿”的价值,远未被人们挖掘,主要由于技术本身确实存在的挑战,还有人们对数据的重视程度和认知程度不足。

他指出,七牛是全世界第一个提出用存储、加速和数据处理这三个词来描述云存储服务的公司,这与其他云服务商仅将云存储作为云主机附属品的思路有很大不同。并且,为了更好地服务于平台上的28万企业用户,七牛用KODO对象存储服务、FUSION融合CDN管理平台、DORA就近计算平台、PILI直播云服务四大产品重新定义了云存储,志在成为最开放、最完备的数据服务提供商。

以下为演讲实录,略有删减。

感谢大家对于七牛的支持,今天能举办D-Future大会,从我个人而言,心里感慨万千。七牛到今天已经有四年左右的历史。应该说我们是非常年 轻的一个公司。今天举办这样一场大会,我觉得首先是这个时代给了我们一个这样的机遇。在座的各位都是这个时代的弄潮儿,今天能跟大家谈一谈我们对数据、对 互联网的看法,是七牛的荣幸。我毕业的时候,刚好是互联网这个新兴的产业刚刚开始的阶段,我觉得前面的十几年很精彩,但今天无疑是一个更加精彩的时刻。互 联网刚刚开始的时候,它只是一个新兴的产业,今天大家都在说互联网产业。但是不久的将来,互联网不再是一个新兴的产业,它其实是一个新兴的生产力,和所有 的实体经济和各行各业都息息相关。

我们认为,今天的互联网蕴藏着更巨大的商业机会。互联网之前是一个行业,它的影响仍然只是非常小的一个人群。但是今天,每一个人都已经联网了, 中国超过半数的人群,已经随时随地都在网络上。这给我们的影响是非常巨大的,我们的商业因为有了互联网而重新洗牌。所以,今天所有的公司都有非常大的危机 感,因为如果没有变化,他们很可能会被淘汰。但同时我觉得这也是一个新的机会。谁能跟随上这个时代的机遇,谁就可以成为所在行业的领头羊。这也是为什么那么多人谈互联网转型,为什么大家都会谈创新,谈颠覆。我们正面临着一个前所未有的机遇,如果不变,一定会死。

今天我们的D-Future是一个以数据为主题的会议。因为,如果要用一个词来概括这个互联网时代,我认为就是两个字,数据。实际上信息一直都 存在,只是它以前存在于原子世界,有了计算机和互联网之后,数据存在于虚拟的比特世界。并且这个新的世界正在以每三年翻一倍的速度在膨胀。为什么会有这样 的一个变化?大家去分析一下人的能力就会发现,人本身的逻辑能力和计算能力是非常有限的,我们很难去很快地执行一个对计算机来说非常简单的任务,例如 71×131等于多少。我相信多数人都不能很快地答出来,但计算机执行这样的计算,是纳秒级的。计算机和互联网扩展了人的逻辑能力,让我们有了很强的分析 和预测未来的能力。在这样的数字化洪流下,我们的商业将受到非常巨大的影响。所以今天我们也想谈谈互联网转型后的商业新常态到底是什么样的。

首先,我们来看一看业务本身。互联网化最基础的一个诉求就是业务上网。想象一下,或者我们对比一下传统的商业和新兴的商业形态,最大的一个不同 是什么?如果我们用一个词去概括旧的商业形态,我个人想到的一个词是“一手交钱一手交货”,这就是旧的商业形态最基本的特色。但是互联网改变了这一切,互 联网让远程交易成为了可能。远程交易产生一个服务对商业的影响是非常非常巨大的。我们的业务场景比以前开阔了很多,我们以前只能影响我们周围非常小的一群 人。最多我们的公司做大了之后,在不同的地方开不同的分部,但是影响的人群仍然只是公司能到达的范畴。

但是互联网改变了这一切。我们来分析一下互联网时代业务的特征。我也概括了一个词,“非结构化数据是人类最自然的沟通方式”。什么叫非结构化数 据呢?我们自然表达的语言文本以及图片、音频、视频等媒介,都是非结构化数据。这些数据是人类非常容易理解的,但是计算机很难理解。计算机有非常强大的逻 辑能力,但计算机在语义的理解上是非常原始的——可能连三岁婴儿的水平都达不到。非结构化数据就是传递人的意愿。比如,我拿起电话说几段语音,告诉对方我 想要的东西。或者是通过图片,表达一个商品长什么样,商品该怎么使用的。我们可以看到,非结构化数据自然而然会成为交互的一个中介。而这也是原子世界映射 到比特世界一个根本原因,因为业务要上网。

第二,当业务上网之后,我们的运营会发生质变。旧的商业过程当中我们也会谈运营。在旧的商业过程当中,大部分的企业会做调查问卷,会找一些样本 的客户去问他们,对我们的服务有什么看法,希望我们做什么样的新服务。但是今天我们会发现,有了计算机、有了互联网之后,这一切也发生了变化。首先业务上 网之后,可以天然地记录每一次的交易过程,能把所有用户的行为都记录下来。今天我们不是取样数据,而是全量的记录用户的行为。对于任何一个互联网公司来 说,每天都在产生上千万上亿的调查问卷,而这些调查问卷,如何去改进我们的商业模式,是一个非常重要的课题。也是我们今天为什么会谈大数据,会谈精益运营 的原因。

我们先看一看非结构化数据的挑战。刚才讲了,现在数据世界正以每三年翻一番的速度在膨胀,而这其中95%以上都是非结构化数据,而且这个比例还 在不断的提升,而不是下降。也就是说我们会有越来越多的非结构化数据产生。如此惊人的数据,应该如何收集,如何保存,如何进行分析和挖掘,这又是一个很重 要的课题。非结构化数据,主要的用途是用来做交互,但是今天计算机对于语义的理解是非常原始的。所以在交互上,我们发现它仍然有非常巨大的提升空间。我们 知道有自然语言分析、NLP这样的一些技术,但是它们今天仍然很原始。我们还有语音识别,有视频或者图片里面对于场景、对于动作的捕捉与识别等,但是这些 新的分析方法都还非常的早期。这些新的分析方法如果能够往前走的话,那么这个数据时代会有多大的想象空间。正因为我们的分析能力还很原始,所以今天几乎所 有的非结构化数据都没有二次分析。用户每一次沟通,每一次交互过程当中,都沉淀了大量的信息,这些信息如何挖掘,是很重要的课题。

接下来谈一谈用户行为的记录,我认为这个是远未充分挖掘的金矿。因为今天很多企业没有用户行为记录,他们大部分业务还没有联网。所以他们今天想 得更多的是让业务上网。但是其实哪怕是互联网公司,今天日志的处理能力、分析方法,以及产生对经营有效指导的能力依然存在很多不足。大部分的公司停留在比 如日活用户的分析等基础的阶段。

第三点是,绝大部分企业日志会定期删除,因为他们不能理解数据分析之后还能干什么。日志是计算机生成的,所以它天然可以很容易被计算机去理解, 这个理解是全面的,不会损失什么信息。所以日志本身是一个更高含金量的金矿,但是大部分的企业其实并没有意识到这一点。所以我认为,今天日志的使用量,还 处于一个非常原生的状态。

那么今天谈这些对于我们来说有什么意义呢?这个就涉及到七牛对于自己的定位。如果用一句话来描述七牛对于自己的定位就是,七牛是最开放、最完备的数据服务提供商。最开放的含义是 什么呢?我们希望不是七牛把所有的数据服务给提供了,而是希望搭建一个平台。因为我们刚刚分析了非结构化数据,分析了日志相关的一些挑战,这些挑战绝不是 七牛一家公司所能解决的,我们希望有志于去提升数据应用价值的企业,都能够和七牛一起共同开拓这个世界,而不是单独一家去做这样的事情。最完备的含义是, 我们希望能够分析数据的使用场景,去触及它的方方面面,去构建一个完整的技术栈,构建一个全息的商业模型。这是七牛对一个数据服务商的定位。

今天七牛做了一些什么呢?大家都知道七牛现在叫七牛云存储,其实在七牛出现之前已经有很多的云存储供应商了,最典型的是亚马逊。但是我们认为, 我们重新定义了云存储这个概念。为什么呢?因为在AWS上的S3,我们认为它是一个零件,什么零件呢?就是云主机的附属品。S3主要的能力是一个数据仓 库,它可以放东西,可以取东西。但七牛认为云存储不应该仅仅是一个数据存储的空间。首先,它是一个数据存储的空间,所以我们有数据存储这样一个基础服务。 作为基础服务,它的核心价值很简单,就是可靠,然后便宜,然后高可用,这个是它最基础的几个能力。第二个能力是加速。七牛可能是全球第一个提出用存储、加 速和处理这样三个词来描述云存储这样一个服务的公司。当然后面我们看到业界也逐渐地认同了这样一个模式,几乎所有的云存储都在往这个方向走。

那么加速是什么呢?七牛的加速是用一个相对比较独特的方式,因为大家听到加速这个词,都会想到CDN,而CDN是存在了十几年的一个服务形态。 七牛的加速到底和CDN有什么不同呢?这跟七牛的做事方式很有关系。我们认为市场上不差一个新的CDN公司。所以七牛对加速的定位是做一个CDN融合的公 司。我们希望协助客户管理CDN,让这些CDN融合在一起,能够提供更高品质的,或者是更高可用性的CDN。因为任何一家CDN,都可能会出现区域性的故 障,这样的情况下,我们可以协助自动地去解决问题。例如,有一些CDN可能在上海快一点,有的CDN在广州快一点,我们可以融合,可以形成更高速的访问。

然后是数据处理。数据处理这个词比较抽象,如果展开来讲,它会呼应我刚才讲的那个非结构化数据的挑战里面最重要的一点——计算机对于非结构化数 据的理解其实是非常原始的。所以七牛成为一个真正开放的云存储厂商,最重要的点在于我们的数据处理是一个开放平台。七牛最近接入了非常多的数据处理服务, 例如图片鉴黄、广告过滤服务和文档转换服务等,还有正在接入的人脸识别等。

还有什么呢?还有一点就是直播!因为视频或者音频,它是一个非常特殊的介质,因为它有一个在线沟通的需求,这是传统的存储所没有的。当然因为视 频和音频本身有流媒体的属性,所以它天然有点播的需求。七牛的霹雳云是将直播和点播融合的平台。我们可以在霹雳云上完成用户的沟通,事后的点播,以及不同 的网络下不同码率的转换。

介绍了七牛当前云存储的概念之后,我们来看看七 牛的一些数据。今天七牛的注册企业有28万,直接覆盖网民每月月活3.7亿,平台上产生了1600亿的文件,每天有750亿的请求。我们的数据处理本身可 以被加速,也就是同一个文件,哪怕它多次访问,它只会处理一次,所以它的量会相对少一点。今天七牛的平台上每天有12亿数据的处理量

总结一下,七牛干了什么?我们认为我们重新定义了云存储,重新定义数据如何服务商业。很多人会问七牛未来会做一些什么,七牛到底会往什么方向发展?我认为要符合这个时代的主题思想,就是创新和创造。今天和数据相关的几个词有云计算、有大数据。这些词七牛是如何看待的,如何重新定义这些词?我认为2016年可以期待。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章