跨国消费者信用报告公司Experian是一家以数据为驱动的公司,而走在最前沿的,就是这家公司下属的Experian DataLabs部门,该部门主要负责寻找通过数据颠覆和变革业务的新机会。
Experian高级副总裁、Experian DataLabs北美首席数据科学家Kevin Chen表示:“如果我们看到一个机会,并相信这个机会能够给我们的客户带来高收益和高回报,我们就会投入研究资源,尝试提出一个可以产品化的原型。”
DataLabs团队可以自由地进行试验并着眼未来,当团队将一个想法付诸实践的时候,会把解决方案交给业务部门运行,然后把注意力转向其他新的机会。
Chen说:“我们总是有新的想法可以尝试,这实际上也是我们从市场中招揽人才的一个吸引点。”
无代码AI的诱惑
Experian DataLabs专注于发现Chen所谓的“高影响力问题”,这种问题的解决方案可以帮助实现业务的转型。
举例来说,Chen提到了Experian DataLabs的一个项目,该项目涉及到要把来自Experian多个业务部门数据链接在一起,而且这些业务部门并不局限于消费者信用业务,还包括商业信用、针对在线和离线的营销,甚至是医疗IT业务。
“所有这些数据都分散在整个公司上下,而且之间并没有真正的交互,”Chen在谈到Experian以前的数据实践状态是这样说道。他说,将所有这些数据链接在一起并非易事,某个人可能以很多种方式出现在这些数据集中。DataLabs使用机器学习来研究数据集并匹配个人来解决这个问题。
“一旦我们构建起这个解决方案,就会产生15个或者16个不同的应用。”
现在,无代码AI成了DataLabs一个重要的研究领域。无代码AI可以用于部署AI和机器学习模型的拖放界面,使非技术用户也能在不依赖数据科学家的情况下利用AI。Chen认为,目前这还不太现实:即使有了无代码AI,企业组织也需要具备数据准备专业知识和数据处理技能的人员。
他说:“通过无代码AI,我们试图做的是让非技术人员能够访问数据,但这并不意味着数据会自动出现。在这一点上,当我们谈论无代码AI时,我们实际上谈论的是如何让人们能够分析数据、从数据中获得洞察、以及在不一定有能力提取数据的情况下分析数据、查询数据或执行建模。”
在过去的几年中,Experian一直在构建Ascend Analytical Sandbox,这个高级分析沙箱是基于Experian公司18年来积累的2.2亿消费者信用数据以及商业数据、房地产数据和其他数据源。
“Ascend Analytical Sandbox本质上是Experian拥有的消费者信用行为数据的一个宝库,它是完全匿名的。我们打造这个沙箱是为了让科学家,无论是Experian数据科学家还是外部数据科学家,都可以探索数据。”
但无代码AI可以把这个概念推得更远,例如可以把这个沙箱和数据直接开放给业务决策者,例如风险经理。
“他们可以查看数据了解客户的趋势,以及他们与同行的比较,等等,我们希望他们直接使用直白的英语就可以访问数据、查询数据和询问有关数据的问题。”
另一个名为Ascend Interact的项目,旨在使用深度学习、自然语言理解(NLU)和自然语言处理(NLP)让业务决策者能够直接与Experian的海量数据进行交互,而无需通过数据科学家团队实现。”
“我们现在可以将数据与各种用户进行共享,并且这些用户可以立即根据数据本身做出更直接的决策,而不是只把数据交给客户的数据科学家。”Chen指出,必要的时候数据科学家仍然可以提供帮助。“这种变化本质上是让决策者重新掌舵,而不需要总是依赖他们的数据科学家。”
理解意图
该项目仍处于研发阶段。Chen表示,Experian正从两个方面着手,一个是MLOps,将软件工程学科引入数据科学,以简化把机器学习模型投入生产、然后对其进行监控和维护的过程。
“当你从这个角度处理问题时,你就会看到专注于AutoML概念的解决方案,可以把面向用户的机器学习过程实现自动化。”
另一一方面,是侧重于仪表板的商业智能(BI),特别是使用无代码AI根据用户当前的需求提供动态的仪表板。
Chen说,目前主要挑战是如何准确了解用户需要什么。
“我们引入了大量基于深度学习的解决方案,试图了解用户需要的是什么。你需要能够将用户的意图与数据中的真实内容进行关联,然后需要能够开发代码,这样才能真正提供用户所需。”
这个挑战很大一部分来自于领域知识。Chen说,用户通常已经对数据库中的数据有一定程度的领域知识。无代码AI解决方案也需要类似的数据领域专业知识,这样用户才会感觉到他们是专家和专家之间的交流。
好文章,需要你的鼓励