大数据监管驱使下,金融监管机构正在向实时监管、智能监管、穿透监管的模式发展,对金融机构的监管统计提出更为严格要求。数字化能力不足、手工统计较为普遍、竖井式开发、数据不同源、加工不一致、数据应用模式单一成为制约北京银行监管数字化转型的痛点。为了实现“一个银行(One Bank)、一体数据(One Data)、一体平台(One Plat form) ”的数字发展战略,北京银行2022年启动了统一监管数据集市建设项目。
项目定位为“横纵打通”业务模式,实现明细层与指标层、跨报送间数据打通目标。目前已完成包括1104人行大集中、系统性重要银行、EAST、人行金数等11个跨报送体系的约 6万项监管统计指标和约5000项明细数据资产盘点、整合和口径标准化,完成建设集市的明细层和整合层数据模型,未来可高效响应各类监管报送的要求,实现监管统计管理流程线上化和管理任务的自动化,并通过各类数据应用模式,支持各部门灵活自主使用监管数据,推动监管数据资产对业务及管理的赋能。
具体从五方面推进平台建设:一是通过以监管数据盘点为起点,摸清家底,分析各报送体系的指标、数据的范围,梳理业务口径和技术逻辑,厘清数据上下游链路关系。二是承接监管数据资产的盘点成果,全面覆盖北京银行以及分支机构的明细监管报送主题,建立统一监管集市的明细层。三是北京银行将监管数据质量管理向事前防范和事中管控延伸,从重视 “整改”转向关注“预防”。四是同步优化监管数据认责和认责体系,落实和细化各部门监管数据质量责任,推动解决历史数据认责争议问题。五是金融监管机构鼓励通过场景建设,大数据模型建设,人工智能应用,探索监管数据对业务及管理的应用领域,持续挖掘和释放监管数据的价值,实现监管数据资产由“盘点”走到“盘活”。
统一监管数据集市的架构主要由四部分组成。一是数据源层。即业务系统原始数据的存放地,通过数据湖获得。二是监管数据模型层。分为基础数据和汇总数据,基础数据按照不同的业务主题进行设计,如总账、客户、存款、贷款、银行卡等分类,基础数据在业务主题分类之上,采取多维设计的方式,进行维度和度量的抽象,形成行内可复用、易扩展的监管底层多维数据模型体系;汇总数据则是按照各类监管报送的要求进行数据汇总加工处理,包含指标模型的建立,为后续的前端应用提供易用数据和指标。
三是应用服务层。分为基础功能、指标管理和数据服务,基础功能主要提供满足监管报送相应的基础系统功能,如权限管理、报表管理、报表首页、报表收藏、报表导航和流程管理;指标管理主要是为了实现监管报送指标型数据的高度复用、业务自主定义、业务自主维护的设计思想,将各类监管报送具备同业务口径的指标进行提炼,确保在全行角度对外监管报送的口径一致性和正确性;数据服务则是各类监管报送的数据前端直观展现,和监管机构发布的表样或接口规范保持一致。四是用户层。主要为提供给系统使用者日常使用的功能,如报表填报、数据校验、报表审核、报表查询、系统管理等功能,同时可按照不同的报送机构实体进行分类,如法人机构、分支机构、并表机构等。
统一监管数据集市项目建设成效
统一监管集市平台为企业带来三方面的价值:
一是促生产经营成本下降。解决当前北京银行11类对外监管报送出口不统一,约5000项明细数据的监管数据源分散,约60000项统计指标和底层数据及加工口径不统一等问题,减负约30%的监管数据加工链路,有效缩短约30%报送前数据一致性核查时间,降低监管统计工作管理成本。
二是促协同效率提升。平台可以全面释放每月、季末统计人员约3-5个工作日报表加工时间,有效缩短监管数据质量问题定位时间,同步提升了全行数据一致性,提升全行内部经营统计分析的效率。
三是促经济效益提升。平台的多维指标应用模式有效推动监管数据价值应用投入。通过多维指标体系利用监管数据开展趋势分析、波动性分析、红黄灯预警,或是联合其他业务部门,以业务需求为驱动开展数据价值应用专项,更有预见性的开展行内业务和管理规划。
此外,统一监管集市平台项目成果落地后,将成为我国银行业实现明细层与指标层、跨报送间数据的管理理念,“横纵打通”式监管数据集市的成功落地案例。项目也促进了包括通过绿色、普惠金融、供应链等全行数据标准的统一和有效执行,补充了行内现有的数据标准缺口,对绿色、普惠金融、供应链等业务的有序开展提供了标准引领作用。
好文章,需要你的鼓励
安全公司Backslash Security警告称,Cursor AI编程助手的YOLO自动运行模式存在严重安全隐患。该模式允许AI代理在无人工审批情况下执行多步骤编程任务,但其拒绝列表防护机制极易被绕过。研究人员发现至少四种方法可绕过命令限制,包括混淆编码、子shell执行、脚本文件写入等。恶意指令可通过导入未审计的GitHub文件或处理被注入的代码库内容传播,使文件删除保护等安全措施形同虚设。
加利福尼亚大学和萨里大学研究团队开发了一种创新的AI系统,能够仅通过简单的手绘素描就在复杂照片中精确识别关键点。这项技术突破了传统机器学习需要大量同类数据的限制,实现了真正的跨模态学习。系统在动物关键点识别任务中达到了39%的准确率,超越现有方法约5个百分点,并且在真实手绘素描测试中表现稳定。该技术有望在生物学研究、医疗诊断、工业检测等多个领域找到广泛应用。
数据中心服务器通常部署在机架或机箱中,但两者并非同一概念。服务器机架是容纳多台服务器的金属外壳,通常垂直堆叠;而机箱是容纳服务器内部组件的外壳,是机架内的较小模块。机架服务器体积较大,通常占用单个机箱;刀片服务器更小,可在一个机箱中部署多台。理解两者区别对数据中心设计至关重要,影响服务器类型选择、冷却效率和硬件部署方案。
约翰霍普金斯大学发布DOTRESIZE技术,通过最优传输理论实现AI大模型智能压缩。该方法将相似神经元合并而非删除,在保持性能的同时显著降低计算成本。实验显示,压缩20%后模型仍保持98%性能,为AI技术普及和可持续发展提供新路径。