至顶网CIO与应用频道 11月09日 人物访谈(文/王聪彬):受金融科技的影响,金融行业已经把科技摆在了非常高的位置,不论是美国金融机构还是中国金融机构都在科技上做了非常多的投资,其中一些中国银行还称自己是科技公司。
也许是企业文化所致,美国富国银行并没有想要成为科技上的第一名,他们的目标是懂得应用科技来帮助金融,也就是先有策略再选科技。
因为在中国金融行业中“量中取质”是非常常见的做法,但相对成熟稳定的美国金融市场,在没有明显流量增长的情况下,运营的主要策略就是利用数据分析让效能和效率达到最优。
人口红利褪去后的数据分析价值
在今年8月,富国银行企业模型风险部副总裁刘维政(Richard Liu)来了一趟中国,从北京到上海再到深圳,一路下来除了见见老朋友,最重要的日程还是应Teradata天睿公司之邀和中国多家银行进行交流。
富国银行企业模型风险部副总裁刘维政(Richard Liu)
交流的主题是数据治理,听到这个议题我其实有些诧异,因为中国大部分银行在内部数据治理上还是有一定的积累。
“中国整体银行业有着非常好的基础,但在数据治理上还是有一定距离。”刘维政表示,数据的使用要分两个阶段:第一阶段,收集数据,更多的还是交易数据,为核实和产生报表使用;第二阶段,使用数据对顾客进行360度的场景描述,以及新产品的设计。
数据在保存下来之后,银行都在思考如何把数据真正应用到营销甚至风险管理中。“中国很多银行的挣扎在于没有经验。”刘维政看到国内很多银行都在使用互联网数据,但并不是将内部数据和外部数据整合就天下太平了。
银行在拿到外部数据进行整合时会发现,内外部数据很难做连接,所以整体的效果并没有很大提升。银行现在还在不断寻找解决方案,而像富国银行或者一些美国银行已经懂得如何用自身的交易数据发现客户行为。
所以在各家银行营销策略逐渐趋同的当今,银行急需一套系统化的辩证方法。当然产业到了一定的成熟度后,产品和服务的差异就会越来越小,效能和效率自然而然就成为新的竞争点。刘维政提到,在这个阶段谁可以用更少的成本提供更好的服务,甚至维持服务,这就到达了思维的转变。
人工智能与效能和效率思维
刘维政把自己的工作描述为找出“披着羊皮的狼”,也就是风险管理。但现在的欺诈已经越来越隐蔽,它们往往伪装成一般交易情况,而根据异常值抓取欺诈的情况已经越来越困难,所以富国银行开始使用人工智能AI来加强风险管理。
AI可以对非线性关系进行探查,这让隐蔽的欺诈再次变得透明。传统线性关系是指超过某一指标后产生的异常情况,而非线性指标是指发现一个行为有所谓模式产生。刘维政举例说,像某人突然在每个月出现现金交易,但没有超过指标,人工智能就可以产生警示,很好地从非线性、非结构化数据之中发现特征。
在AI的应用上,富国银行分为内部和外部两种,外部主要针对恶意取得不当利差,内部主要针对银行系统操作过程。
每一个新技术的出现都会让大家惊艳,就像AI,但普及化依然是企业最大的挑战。在人工智能应用的过程中,富国银行同Teradata合作建立分析平台,一方面获得更多算法抓取不当行为,一方面减少人工开发、分析时间等成本,所有的一切又回到了效能和效率上。
当然金融行业常见的三种AI应用:机器人流程自动化(RPA)、聊天机器人(Chatbot)、机器人投资顾问(Robo-advisor),富国银行也在不同程度地应用,同时其还与Amazon Echo音响、苹果、谷歌进行合作。
其实富国银行一直在观察行业的技术变化,其创新中心在业务上的新想法就有16000多个。刘维政强调,我们不能每一个想法都进行尝试,而是利用相关分析在行业中作比较,这也正如Teradata天睿公司总裁兼首席执行官Victor Lund所言,“如果企业每一件事情都在尝试,那么风险也是不言而喻的。”
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。