科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网CIO与应用频道LinkedIn大数据技术架构蕴藏的秘密

LinkedIn大数据技术架构蕴藏的秘密

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

LinkedIn最广为人知的功能莫过于People You May Know(你可能认识的人)功能,而在第五届云计算大会的最后一天的云计算核心技术架构专题论坛上我们期待已久的LinkedIn商业分析部高级经理Jonathan Wu为我们带来了LinkedIn的数据及技术架构以及案例分享。

作者:王聪彬 来源:ZDNet CIO与应用频道【原创】 2013年6月8日

关键字: 大数据 第五届中国云计算大会 热点话题 数据挖掘 数据分析 综合报道 LinkedIn

  • 评论
  • 分享微博
  • 分享邮件

ZDNET至顶网CIO与应用频道 06月08日 北京消息(文/王聪彬):LinkedIn最广为人知的功能莫过于People You May Know(你可能认识的人)功能,而在第五届云计算大会最后一天的云计算核心技术架构专题论坛上LinkedIn商业分析部高级经理Jonathan Wu为我们带来了LinkedIn的其他特色功能产品和大数据技术架构展示。

LinkedIn是世界上最大的专业人士社交网络,全球范围内有2.25亿用户,并且以每秒2个新用户的速度增长。其还是一个解决方案供应商,88%的财富100强企业在使用LinkedIn的付费解决方案,有超出290万的公司主页及相关讯息。

这些用户为何会选择LinkedIn?Jonathan指出,LinkedIn有专业的身份可以帮拓展人脉发现机遇,专业的内容全方位掌握业界资讯,专业的平台随时随地了解人脉动向。

LinkedIn大数据技术架构蕴藏的秘密

LinkedIn商业分析部高级经理 Jonathan Wu

另外Jonathan还展示了LinkedIn的业务模型,因为其本身就拥有海量的数据,通过这些数据创造出有价值的产品和服务,来增加用户数量和用户粘性,这样数据还会不断增长从而形成了一个闭环。

据悉,LinkedIn有人才、市场、高级订阅服务三大商业解决方案。而且三大将商业解决方案的盈收每年也成翻倍增长趋势,而其中应占盈收比例最大的是人才解决方案。

而在LinkedIn内部50人商业分析团队就几乎支持了70%将近4000名内部员工,其包括了数据集成、数据展现和数据挖掘三大团队,涵盖了市场、销售、产品、研发、运营五个主要商业职能部门,覆盖了三大业务分支。

LinkedIn的数据按用户分为用户特征数据、用户行为数据、用户网络数据。按数据存取速度分为在线数据、近线数据、离线数据。

Jonathan介绍到LinkedIn的大数据技术架构,其三级数据架构根据不同性质的工作设计,其中近线数据存储在Voldemort分布式数据库,在线数据存储在Oracle、Espresso,服务器日志存储在Web Logs。使用Kafka快速将日志转换为数据,并推送到Hdadoop系统中。通过Databus捕获在线数据,而所有的离线数据由 Hadoop 和Teradata数据库构成,推荐数据存储在Voldemort中,以供用户查询。

LinkedIn大数据技术架构蕴藏的秘密

LinkedIn还对开源社区做出了不少贡献,像Azkaban、DataFu、Kafka、Voldemort、White Elephant、Helix、Kamikaze、Norbert等。

Jonathan还带来了3个案例分享,其在290万潜在客户中找到了1300+个销售机会,成为了虚拟的销售顾问。在“个人高级订阅服务”的市场推广上LinkedIn把全部用户从职业社交网络数据、用户身份特征数据、用户行为数据进行筛选最终找到目标人群。进行产品A/B测试,从中选择优胜方投入使用。

此外,LinkedIn做大数据的指导思想也在不断变化,将之前的三角形的底部变小,变换成菱形减少了数据分析和集成的时间,之后的目标是把菱形变成圆形。Jonathan表示,我们做大数据的原则是随时准确的提供信息,并且将大数据做小做快,一个输入一个按钮在小于3秒就可以得出报告。

LinkedIn大数据技术架构蕴藏的秘密

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章