扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNET至顶网CIO与应用频道 07月14日 综合消息:主题为“新银行 新蓝海”的2014年中国银行业座谈研讨会在青岛召开,文思海辉技术有限公司高级经理马宁介绍了数据科学家的工作是什么,以及数据科学家的重要性。
马宁表示,市场对数据科学家的需求一直是非常旺盛的,EMC2011年做过一个调查,大概2/3的企业承认对数据科学家是非常需要的,数据科学家这个抬头被招聘出现了激增的情况,2011年开始出现了快速的增长。并且他们正在帮助银行实现各种数据分析、数据挖掘的价值,这就是数据科学家的价值所在,文思海辉也正在组建这样一支数据科学家的团队。
以下为演讲实录:
今天我们一直在谈论互联网金融,我们首先看一下这两个行业——金融行业与互联网行业——他们的客户的视图上有什么区别?是什么造成了这种区别?然后来看银行如何通过整合自己的内部数据以及获取更多的外部数据,来实现更好的更完善的客户分析体系。基于大数据做客户分析的理想愿景是怎样的?最后,我们来看数据科学家的定位与价值,以及数据科学家和传统数据分析师有所区别的一些地方。
在这张片子中左边是银行的客户视图,无外乎包含自然属性信息、产品签约持有信息和交易信息,这些基本都是围绕着客户的金融属性,我们并不知道客户在交易过程中购买一个产品深层次的原因是什么。即便是这样单一纬度的数据,在银行里都是割裂开来的,客户的零售信息、个贷信息、信用卡信息,被分散到不同的部门中,现在很多银行还很难的把这些信息整合起来形成一套完整的客户视图。
在互联网上客户视图是什么样的?我们可以在淘宝、京东获得消费的信息,在去哪儿、携程网上看到差旅信息,在豆瓣可以知道他们的文娱信息等等,在一些像百度、新浪微博这样的综合性平台,我们可以知道他们的很多需求。以上每一块信息都是片面的,但如果我们把所有的片段结合起来,获得的就是一个客户的完整轮廓描述。在这个自媒体时代大家很倾向于分享个人的信息,因此这里面很多数据在网页上都是可以看到的,可以使用数据接口或者爬虫技术直接获取,这也是与银行客户信息一个典型的差异。
银行的数据分析与挖掘集中在客户管理和风险管理两大领域。风险管理中信用风险中的客户评级,流动性风险中的客户行为建模,也都是围绕客户展开的。因此,分析客户、了解客户,是我们银行数据挖掘的重中之重。
无论是打破部门之间的数据壁垒,还是基于更多的外部数据去做客户轮廓分析,都已经被包括银行业协会的赵主任、文思海辉的况总,上海银行的邬总在内的多位专家提到过了。呈现一个全面的360度客户视图,这是银行分析领域的重要需求。
我们希望借助更多的外部数据描述客户轮廓:
做客户细分时,融入他们的生活方式,划分为新潮自由型、传统安逸型等等,这种划分方法已经在一些行业得到了应用,比如万科就是以这些研究住宅定位的。
做精准营销时,我们以前经常会做一些很炫的统计模型,如神经网络、决策树、Logistic回归,但最后得到的规则,无外乎就是客户买了产品A,因此我向他推荐一个类似的产品B。我们应当研究客户在银行的生命周期,是在获取器阶段?还是成长阶段?成熟阶段?甚至流失阶段?也应当研究客户自身的生命阶段,在上学读书?还是初入职场?结婚生子?退休养老?在每个不同的人生阶段,客户对银行都有不同的产品需求。我们还可以收集客户网银点击信息,他在哪个页面哪个位置上停留的时间长?我们都有相对应的营销策略。
在做客户价值分析时,如果知道客户的当前价值、潜在价值、亲友价值,甚至一些客户背后是有小微企业的,此类企业的价值,这些都可以纳入到分析中,这样我们对客户价值的判断将更为精确。
做客户流失预警时,呼叫中心能否及时从语音中判断语速的快慢,情感的正负?是否统计分析过客户住宅周围本行它行的网点的分布?这些额外的信息都比简单看到客户资产减少、活跃度下降来判断流失倾向更有价值。
刚才所描绘的这些美好愿景并不是空想,有些银行已经开始在这方面的尝试。Zions银行总部位于美国犹他州,收集人口统计局、劳动统计局、劳工部等多渠道外部数据,确定在犹他州新建分行的位置以及主打服务:在低收入人群聚集区建立的网点,主营储蓄、支票和贷款服务;在西班牙裔和亚裔聚集区,提供区域特色小微金融服务。Zions也判断用户对电子产品的喜好程度,针对性推荐移动App。
JP摩根使用大数据,把客户信誉的研究变成客户行为的研究,他们的CIO说我们接下来需要的是客户行为的专家,而不是统计学家或者IT专家。他们会去记录客户是否经常外出吃饭,是否在高端商场里消费,还是以牺牲距离的方式换取打折的商品,他们在网络上发表了什么样的评论,都会被收集起来,他们把客户细分再细分,甚至不惜细分到单个的人,实现一对一营销。当客户走进银行网点大堂,当客户打进电话的时候,这些客户的自然属性、分析属性,都呈现在客户经理或接线员的屏幕上。
花旗银行使用IBM的Watson超级计算机,分析非结构化数据,除了用于股票投资以外,也会从Facebook收集用户的评论以及信用相关信息。
其它的一些金融业相关机构,如征信公司,除了使用传统的方式,他们会研究客户姓名的大小写与信用的关系,甚至发现开德国车的用户比开日本车的用户对风险更敏感。
银行获得更多数据的途径总结为五点:利用现有平台增加获取的渠道,如记录官网、网银点击流;把现有非结构化数据转换为结构化数据,如语音、文本识别;自建互联网平台做电商、P2P平台;利用爬虫技术获取Web数据;与其它行业如电信、电商、物流的数据提供商合作等等,各种渠道现在在银行里都有所开展和尝试。
什么是数据科学家?网络上有很多定义,我不想通过一句话来描述。我们来看数据科学家与传统数据分析者差异是什么,进而刻画数据科学家这一崭新职业。除了上文列出的传统数据分析者具备的技能以外,数据科学家应该具备的额外技能还包括:转换非结构化数据的能力;对复杂不精确的数据进行模糊匹配与整合的能力;基于海量数据使用相应的分析技术,最终把分析出来的结果还原到业务流程,最终支持业务决策的能力。
市场对数据科学家的需求一直是旺盛的:EMC2011年做过一个调查,2/3的企业承认对数据科学家是非常需要的,数据科学家这个职位的需求在招聘网站indeed.com上自2011年开始出现了激增的情况,并持续快速增长。
数据科学家的价值是什么?具备以上技能的这样一个人或一支团队,帮助银行实现刚才所介绍的各种数据分析、数据挖掘愿景的价值,就是数据科学家的价值所在,文思海辉也正在组建这样一支数据科学家的团队。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。