扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
数据仓库区别于业务数据库
数据仓库就是统一标准化的数据集成平台,与业务数据库有什么区别呢,业务数据库主要面向事务的设计,而数据仓库是一个面向主题的、集成的、相对稳定的、反应历史变革的数据结合,用于知识管理和决策。
数据仓库的特点有五个方面,一是面向主题,围绕主题组织数据;二是集成,是集成整个企业的数据;三是相对稳定,数据操作主要是查询,而删除和更新操作比较少;第四是保存主要是历史数据;第五是不产生数据源,数据来自其他的业务系统。数据仓库的用途就是支持决策和分析。
数据仓库的优点主要有三个方面,一是提供全行统一的业务描述和单一的信息视图,业务系统只是提供本系统的数据,而数据仓库是整合了全行各个系统的数据;二是保存历史数据,业务系统只能提供当前的最新数据,而数据仓库可以提供历史上有,但业务系统无法再现的一些数据;三是不面向某个特定的系统,业务数据库是面向事务的设计,针对特定系统,而数据仓库是面向主题设计,可以适应各种分析和应用。
兴业银行数据仓库建设历程
兴业银行企业级数据仓库项目的启动时间是2005年9月5日,投产时间是06年4月30日,历时八个月,项目的开发实施伙伴是NCR公司。
这个项目主要为兴业银行解决了三大方面的问题,一是数据分散、信息不能共享,这方面的问题主要的表现有,数据分散存储在各个系统中,形成信息孤岛,相互之间信息不易共享,有信息流失的可能,在数据利用上,各系统相互独立,存在功能重复开发,还有一个就是分散的数据需要整合。第二是数据规范业务标准不统一,具体表现为分类标准不一样,代码不会犯,分类标准不一样,需要全行统一客户,渠道和分类标准,各系统间的数据借口,数据传输和数据交易需要定义,系统间的数据交换复杂而低效。第三是历时数据的保留问题,这方面的问题就是历史在线保留也是许多应用所需要的功能,还有BISII协议对历史数据的存储也进行了要求,现在最低存储年限是三年。还有历史数据是决策分析的基础,没有历史数据我们就无法进行更深一层次的数据挖掘。
兴业银行数据仓库建设的有两个总体目标,一是以客户为中心,以数据为基础,建立一个涵盖兴业银行各种业务数据、集成统一的、标准化的数据集成平台,实现统一的信息资源管理。二是为全行各级管理业务人员提供信息查询,动态报表,多维分析和数据挖掘等服务, 为全行客户信息管理、客户关系管理、风险管理、绩效考核、产品利润贡献度分析、财务管理等提供有力科学的决策支持,在业务上达到对外营销与队内管理的双重目的,以提高我行的决策水平,和核心竞争力。
在数据仓库业务应用方面,数据仓库为兴业银行提供的服务有预定义报表、报送报表、产品化应用、以及对数据挖掘提供支持等等,同时还提供了查询服务。
目前兴业银行数据仓库已经实现了全行统一的数据视图,已经有9个下游系统是建设在数据仓库基础之上的,同时数据仓库也为五个系统提供数据服务。在这个过程中,我们也积累了大量的配合下游系统应用的经验,形成了配合下游系统应用的成熟开发流程和规范。
数据仓库搭建分析系统初探
众所周知,数据的价值是分析和挖掘出来的,所以兴业银行在数据仓库的基础上也进行了初步数据分析和挖掘的探索。
所谓数据挖掘就是从大量的、不完全的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们实现不知道的、但又是潜在有用的信息和知识的过程。下面我们来介绍一下,兴业银行零售信贷数据挖掘,这个项目的目的在于对本行个贷数据进行全面梳理和分析,提供本行个贷业务完整视图。
增长情况方面,在历史数据基础上对兴业银行从2003年底到2007年6月底个贷年均复合增长率进行测算,并根据与零售储蓄增长情况比较,提出了促进资产负债的平衡增长,谨防流动性的风险的相关建议。
产品定价方面,兴业银行对各个贷品种的定价情况进行考察,并以人行基准利率为标准,对各品种的定价高低进行排序,识别定价较高的品种,为营销策略、方式的确定提供支持。
风险方面,根据现有违约数据,区分出全部个贷品种中不良余额最高和不良率最高的两个品种,并建议加大对这两个品种的风险控制力度。
客户方面,根据个人住房贷款合同金额分段考察客户情况,识别出个贷业务的主要客户群,并对该客户群从贷款期限、年龄、性别、区域等维度进行深入的特征分析,为拓展新的个贷客户提供支持。
成本收益方面,对各业务品种、期限结构、各地区的个贷成本、收益进行分析,识别利润较高的品种、地区,并对其原因进行调研和分析,为提高其他品种、地区的个贷收益提供指导。
我们基于数据仓库,也进行了全行零售客户的分析。
客户基本情况方面:
兴业银行的活期、信用卡、个贷、基金与理财是目前客户数比较集中的业务。包括潜在客户在内的总客户数2007年增长比较2006年超过50%,主要是信用卡系统的贡献,增长数达到180%。兴业银行目前的零售客户主体年龄在20到30岁之间,性别男女基本相等。
从产品和客户年龄之间的关系,可以看出存款和基金客户的平均年龄,是相对比较低的,而国债和理财客户的平均年龄比较高,可以达到51岁以上,这也是与实际情况相匹配的。因为毕竟老年人的理财和风险意识都比较强。
高端客户方面:
我们对本行高端客户进行了定义和区分,识别出符合20/80原则的高价值客户,并对其特征进行分析,同时对稳定高端客户和瞬间高端客户进行识别,发现潜在高端客户,指导各机构的营销,提高高端客户占比,促进零售客户资产增加。
用年日均资产达到高端水平的零售客户数量与当年单日最高资产达到高端水平的零售客户数量进行比较,可以分析除各家分行对潜在客户的开发和保持情况。在高端客户稳定性低的分行,我们建议他们保持客户稳定,提高客户的忠诚度。
根据对高端客户产品持有情况的分析,发现资产配置结构相对不合理的客户,并建议其调整资产结构,达到客户保值增值和银行提高收益的双赢。
交叉销售机会识别方面:
根据对客户年龄和信用卡消费次数的关系的分析,可以看到各年龄段信用卡消费次数情况,同时,对只有理财卡,或者只有信用卡的客户年龄分布进行分析,发现信用卡、理财卡客户交叉销售的机会,这样目标客户明确,销售的成功率也比较高。
通过识别持有个贷产品但无信用卡的客户,并分析其特征,发现个贷产品和信用卡产品的交叉销售机会,并向营销部门提供该类客户数据,指导各分支机构进行交叉营销。
兴业银行近几年在银行业中发展很快,这主要是依托于信息技术的应用,特别是数据挖掘为其业务带来了新的突破,未来还将更多的应用于业务运营中。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。