至顶网CIO与应用频道 07月14日 人物访谈(文/王聪彬):LinkedIn(领英)是一家职业社交网站,也是一个数据驱动的公司。数据分析对于业务有着重要的贡献,为职场人员作出迅捷、高质、高效的决策,提供具有指导意义的洞察和可规模化的解决方案。
LinkedIn拥有将近800人的数据团队,其中分为几大部门,第一、基础设施团队,负责设计并搭建基础设施平台包括大规模社交联系人数据库等;第二、分析平台和应用团队,负责数据的ETL,以及开发一些数据平台,像A/B测试平台、报表平台、单一数据源平台等;第三、机器学习团队、构建机器学习、数据挖掘的模型;第四、数据分析团队,从数据分析中发现洞察为业务部门提供建议。
几个团队间相互配合,像LinkedIn需要大量的A/B测试,通过与分析平台和应用团队建立了自助服务的A/B测试平台,其可以自动计算和统计出数千个度量(metric)指标,让管理者、工程师、合作伙伴很容易的创建和查看,这也让数据科学家可以减少大量手工计算,进行更高附加值的工作。数据分析团队就可以更好地将洞察提供给不同层面的人员,帮助业务决策以及发现新型业务机会。
LinkedIn的数据分析团队分为三部分,core支撑业务部门的数据需求、strategy进行战略性投资以获得长远的回报、venture尝试新的成功可能性,有发展机会就会变成项目。
LinkedIn(领英)增长与国际业务数据科学负责人周洋所在的是数据分析团队中的增长,生命周期与国际业务部门,主要负责客户获取、用户生命周期与黏性、国际业务。周洋说现在增长要更加细分,确定战略性市场和用户群并定制增长战略。中国的团队也属于整体国际团队的一部分,他们的职能在于优化产品在本地市场能够成功,同时将很多创新想法快速实现,并带回到全球市场。
LinkedIn(领英)增长与国际业务数据科学负责人周洋
增长的三次革命
说到增长,最火的一个词就是Sean Ellis 提出的“Growth Hacker”增长黑客,其帮助硅谷多家公司完成产品的快速增长,其中不少已经IPO,最著名的非Dropbox莫属,仅一年的时间用户基数和使用频率提高了500%。
大多数人理解的增长都是用户的获取,而LinkedIn的增长团队对于增长有着三次革命性的认识变化。
第一、用户黏性,LinkedIn首先提出用户生命周期的概念,将用户按照活跃度划分成不同的级别,理解不同级别之间的转化并指定战略让低活跃级别的用户向上移动;
第二、注册质量,用户获取的目标应该是有质量的获取,LinkedIn根据通过核心价值定义了自己的关于用户增长的北极星指标(“North Star Metric”),不断优化用户获取;
第三、高质量用户,通过衡量LinkedIn的上亿用户在整个生态系统中接受核心价值所处的状态,来定义高质量用户。
“增长不是一个短期行为,也不是一个战术方式,而是深刻了解增长价值的核心在哪里。”周洋说,只有深刻理解才能定义北极星指标,之后再从用户群的过渡、不同渠道、漏斗转化率等角度优化它。增长最终的目的是为用户提供价值,以及为业务提供价值。
增长黑客的方式可以为企业带来爆炸式的增长,但前提是企业要有一个产品与市场匹配,创造价值同时优化传递价值的过程,最后就是这样扩大增长规模。
每一个产品都有研发周期,从产生创意、文档、设计、实施、测试、上线的各个阶段,LinkedIn的增长已经渗透到产品的各个层面。数据团队和产品团队会一起定义成功的metric,之后在中间各环节配合,最终根据成功metric确定产品是否成功,上线后会进行监控,同时进行深度分析从而进一步优化。
数据科学家肩负决策与创新
2008年,LinkedIn的数据科学团队负责人DJ Patil 和Facebook的Jeff Hammerbacher分别建立了全世界最初两个真正意义上的数据科学团队,并且开始用数据科学家(data scientist)来描述他们的工作性质。在此之后,Data Science职业逐渐流行开来。
当然即便数据科学家已经兴起了一段时间,但即使在美国其还是一个比较新型的行业。周洋认为,虽然现在很多学校开设了数据科学的相关课程,但要成为一个优秀的数据科学家必须要在业务中去历练,因为我们的工作是非重复性的,解决的业务问题都应该是新问题。
作为一个数据科学家一定要具备好奇心和直觉。 他们需要想的问题是:我能用这些数据来做什么呢? 我需要问什么样的问题?这些数据能告诉我什么?数据科学家的工作包括通过数据分析发现商业洞察,进而提出商业决策或者商业创新的建议,并与其它团队一起将这些想法落地实施 。
LinkedIn的数据科学家有两大核心工作和数据部门整体的目标相辅相成,第一、用数据驱动商业,帮助业务团队进行决策;第二、用数据驱动业务创新,优化流程,发现商业机会。当然这些工作会渗透到LinkedIn的所有业务中,包括2B业务和2C业务。
在数据科学家的划分上,一部分在垂直领域,对应不同的业务,和业务团队一起工作,更好的了解该业务的痛点;另一部分在水平领域,创建并开发可重用和可扩展的数据工具。
LinkedIn数据科学团队的宗旨是:To make data-driven business decision at scale。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。