跨国消费者信用报告公司Experian是一家以数据为驱动的公司,而走在最前沿的,就是这家公司下属的Experian DataLabs部门,该部门主要负责寻找通过数据颠覆和变革业务的新机会。
Experian高级副总裁、Experian DataLabs北美首席数据科学家Kevin Chen表示:“如果我们看到一个机会,并相信这个机会能够给我们的客户带来高收益和高回报,我们就会投入研究资源,尝试提出一个可以产品化的原型。”
DataLabs团队可以自由地进行试验并着眼未来,当团队将一个想法付诸实践的时候,会把解决方案交给业务部门运行,然后把注意力转向其他新的机会。
Chen说:“我们总是有新的想法可以尝试,这实际上也是我们从市场中招揽人才的一个吸引点。”
无代码AI的诱惑
Experian DataLabs专注于发现Chen所谓的“高影响力问题”,这种问题的解决方案可以帮助实现业务的转型。
举例来说,Chen提到了Experian DataLabs的一个项目,该项目涉及到要把来自Experian多个业务部门数据链接在一起,而且这些业务部门并不局限于消费者信用业务,还包括商业信用、针对在线和离线的营销,甚至是医疗IT业务。
“所有这些数据都分散在整个公司上下,而且之间并没有真正的交互,”Chen在谈到Experian以前的数据实践状态是这样说道。他说,将所有这些数据链接在一起并非易事,某个人可能以很多种方式出现在这些数据集中。DataLabs使用机器学习来研究数据集并匹配个人来解决这个问题。
“一旦我们构建起这个解决方案,就会产生15个或者16个不同的应用。”
现在,无代码AI成了DataLabs一个重要的研究领域。无代码AI可以用于部署AI和机器学习模型的拖放界面,使非技术用户也能在不依赖数据科学家的情况下利用AI。Chen认为,目前这还不太现实:即使有了无代码AI,企业组织也需要具备数据准备专业知识和数据处理技能的人员。
他说:“通过无代码AI,我们试图做的是让非技术人员能够访问数据,但这并不意味着数据会自动出现。在这一点上,当我们谈论无代码AI时,我们实际上谈论的是如何让人们能够分析数据、从数据中获得洞察、以及在不一定有能力提取数据的情况下分析数据、查询数据或执行建模。”
在过去的几年中,Experian一直在构建Ascend Analytical Sandbox,这个高级分析沙箱是基于Experian公司18年来积累的2.2亿消费者信用数据以及商业数据、房地产数据和其他数据源。
“Ascend Analytical Sandbox本质上是Experian拥有的消费者信用行为数据的一个宝库,它是完全匿名的。我们打造这个沙箱是为了让科学家,无论是Experian数据科学家还是外部数据科学家,都可以探索数据。”
但无代码AI可以把这个概念推得更远,例如可以把这个沙箱和数据直接开放给业务决策者,例如风险经理。
“他们可以查看数据了解客户的趋势,以及他们与同行的比较,等等,我们希望他们直接使用直白的英语就可以访问数据、查询数据和询问有关数据的问题。”
另一个名为Ascend Interact的项目,旨在使用深度学习、自然语言理解(NLU)和自然语言处理(NLP)让业务决策者能够直接与Experian的海量数据进行交互,而无需通过数据科学家团队实现。”
“我们现在可以将数据与各种用户进行共享,并且这些用户可以立即根据数据本身做出更直接的决策,而不是只把数据交给客户的数据科学家。”Chen指出,必要的时候数据科学家仍然可以提供帮助。“这种变化本质上是让决策者重新掌舵,而不需要总是依赖他们的数据科学家。”
理解意图
该项目仍处于研发阶段。Chen表示,Experian正从两个方面着手,一个是MLOps,将软件工程学科引入数据科学,以简化把机器学习模型投入生产、然后对其进行监控和维护的过程。
“当你从这个角度处理问题时,你就会看到专注于AutoML概念的解决方案,可以把面向用户的机器学习过程实现自动化。”
另一一方面,是侧重于仪表板的商业智能(BI),特别是使用无代码AI根据用户当前的需求提供动态的仪表板。
Chen说,目前主要挑战是如何准确了解用户需要什么。
“我们引入了大量基于深度学习的解决方案,试图了解用户需要的是什么。你需要能够将用户的意图与数据中的真实内容进行关联,然后需要能够开发代码,这样才能真正提供用户所需。”
这个挑战很大一部分来自于领域知识。Chen说,用户通常已经对数据库中的数据有一定程度的领域知识。无代码AI解决方案也需要类似的数据领域专业知识,这样用户才会感觉到他们是专家和专家之间的交流。
好文章,需要你的鼓励
OpenAI和微软宣布签署一项非约束性谅解备忘录,修订双方合作关系。随着两家公司在AI市场竞争客户并寻求新的基础设施合作伙伴,其关系日趋复杂。该协议涉及OpenAI从非营利组织向营利实体的重组计划,需要微软这一最大投资者的批准。双方表示将积极制定最终合同条款,共同致力于为所有人提供最佳AI工具。
南洋理工大学研究团队构建了Video-MMMU基准,通过300个专业教学视频和900道问题,评估AI模型从视频中学习知识的能力。研究发现人类专家知识增益达33.1%,而最先进的AI模型仅达15.6%,特别在知识适应新场景方面表现不佳。该研究揭示了当前AI在真正理解和应用知识方面的局限性,为未来AI教育应用发展指明了方向。
中国科技企业发布了名为R1的人形机器人,直接对标特斯拉的Optimus机器人产品。这款新型机器人代表了中国在人工智能和机器人技术领域的最新突破,展现出与国际巨头竞争的实力。R1机器人的推出标志着全球人形机器人市场竞争进一步加剧。
清华大学等机构开发的SimpleVLA-RL框架突破了传统机器人依赖大量人类演示数据的局限,让机器人通过强化学习自主试错掌握技能。该方法在数据稀缺情况下将成功率从17.3%提升至91.7%,并在真实世界中验证有效,机器人还自主发现了"推切"等创新操作方式,为机器人智能化发展开辟新路径。