扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
总部位于西雅图的Versium公司, 是一家预测分析行业的新兴公司, 他们的CEO, Chris Matty认为,在诈骗行为开始前,电子诈骗犯是很难被发现的。有部分原因是传统的安全措施已经跟不上现代的技术,让诈骗犯可以利用防火墙的漏洞。“我自己的身份就曾被盗,几个星期前,有人以我的名义试图申请一张信用卡。他们不知怎么获得了我的社保号码, 出生日期及家庭地址,” Matty说。
Matty说,事实上,开设新账户通常是诈骗犯的惯用伎俩,因为一个新建的账户通常不会触动传统防诈骗探测工具的雷达。他说,一位完全新的客户还没有产生足够的行为数据,能够使银行或企业发现其中的异常。但他坚信Verisum可以改变这种状况。
这家新兴公司,成立于2012年,已经积累了3000亿的“ 生活数据 ” ,这些数据涵盖了社交,电子商务,通信活动,人口统计,和社会学图示。如今, Versium正在使用这个庞大的数据库,来探测诈骗。那些金融机构或电子商务企业需要提供什么来追踪诈骗呢? “一个电子邮件地址就够了,”Matty说。
当你建立任何类型的新账户时,都会要求提供一个电子邮件地址,这是建立档案的基础。这一电子邮件地址会在Versium公司收集的四十亿个电子邮件地址中进行检测——其中美国就有5亿个 —— 然后再与3000亿个生活数据进行交叉对比。 档案生成之后,会被输入到一个机器学习算法中,然后对其分析并得出一个风险系数。 “系数越高,风险越低, ” Matty说。
基于数据量——其中大部分是由行为导向的 – Versium就能够评估出“正常”和“风险”行为的级别,这比现今许多企业和金融机构正在使用的系统要领先很多。
数据质量的4项标准
德意志银行纽约分行的电子交易产品开发的总监,Ken Gleason在谈到数据质量时,说“真的是萝卜青菜,各有所爱”。
Gleason说,数据质量取决于它的连续性,而连续性又是由企业需求来进行定义的。企业需要定义数据的要求和标准,以及判断当数据不符合这些要求时,需要采取的行动。 “至于如何做到这一点没有一个正确的,单一的答案, ” Gleason在O'Reilly Media公司举行的数据质量网络研讨会上解密:明确判断你的数据是否达标。为了帮助CIO和IT主管们划分黄金数据和垃圾数据之间的界限,Gleason创建了定义数据质量的4项标准的概念。
完整性:你现在用于特定报告的数据是否完整,更重要的是,你具备你所需要的一切数据了吗? 如果数据或者数据字段缺失,想一想这些数据和报告的相关性,然后决定是否要重新获得那些数据或者数据字段,又或者它们是可以省略的。Gleason说,这里就需要建立相应标准,来确定数据完整性的临界点。
连贯性:数据是前后一致的吗?当把它们都整合在一起,互相之间有关联吗?如果在数据整合时,你发现了问题,就要判断这个问题是不是需要解决,或者是可以忽略的。有一个方法可以验证数据的可靠性,通过检查数据的 “数值完整性”,或者“内部数据总数是否一致”, Gleason说。 “我们一般会等到最后的总数完成,然后进行这个检查。”
正确性:数据值正确吗?Gleason说,如果数据值是无效的或者顺序混乱的,判断它们是否需要改正,或者可以忽略它们,或者对它们进行标记。 “正确性将会是非常领域特定的”,他说,“只有了解数据,了解域,知道哪些是可以接受的,哪些是不可以的,你才可以开始定义并且衡量这些数据。 ”
有效性:数据是从何而来的,谁又负责保存并且维护这些数据? Gleason建议创立一个“内部系统地图”或者绘制一幅数据来源的图标,标注由谁来负责数据,何时进行更新。此外,在流程中增加一个数据验证的步骤。 “这样做的一部分原因是可以确保随着时间的推移,你的数据是时时更新的, ” Gleason说。任何数据流程改变的时候都要进行审核。 “打一个电话,发送电子邮件,询问数据是否依然有效, ”他说。
“对质量要求进行定义,就足以提供一个基准,帮助你更连贯性地思考你的数据,并且节省了时间和金钱,这就是这些标准的价值, ” Gleason说。 “当然,同时也可以减少无趣的重复工作。 ”
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。