您现在的位置: 主页>经济>金融视界> 正文
站内搜索:
数据挖掘技术在信用风险评估中的应用
[作者:wang|来源:|时间:2007-09-12| 收藏 推荐 ]【


  为了进行指标选取,我们使用数据挖掘功能中的关联分析技术。关联分析挖掘发现大量数据中项集之间的关联和相互联系。关联分析广泛用于购物篮和事务处理的分析。它挖掘的一个典型例子是购物篮分析,该过程通过发现顾客放入购物篮中不同商品之间的联系,分析顾客的购买习惯。我们这里使用的算法是Apriori算法。Apriori算法是一种最有影响的挖掘关联规则频繁项集的算法,由频繁项集可以直截了当地产生强关联规则。算法的名字基于这样的事实:算法使用频繁项集性质的先验知识。Apirori使用一种称作逐层搜索的迭代算法,k项集用于探索(k 1)项集。首先,找出频繁1—项集的集和。该项集记作L1。L1用于找频繁2—项集的集和L2,而L2用于寻找L3,如此下去,直到不能找到频繁k项集。找每个Lk需要一次数据库扫描。
  为了验证Apriori算法的可行性,我们根据某商业银行提供的数据,构造了一个数据库,该数据库包含有二千多项事实数据,数据库构造过程如下:将现有贷款样本的模糊化数据构成数据库,模糊化过程为:
  1. 领导者素质、企业经济实力和信誉状况三项由专家打分确定。
 2. 资产负债率、流动比率、速动比率、净利润率和销售增长值根据同行业的具体标准确定。
  这样,每项贷款的风险要素模糊化的表示如下:X1=资产负债率={X11好,X12中,X13差};X2=流动比率={X21好,X22中,X23差};X3=速动比率={X31好,X32中,X33差};X4=净利润率={X41好,X42中,X43差};X5=销售增长值={X51好,X52中,X54差};X6=领导者素质={X61好,X62中,X63差};X7=企业经济实力={X71好,X72中,X73差};X8=信誉状况={X81好,X82中,X83差};用Y1表示贷款风险分类为“正常”,用Y2表示贷款的风险分类为“损失”,在此基础上通过应用Apriori算法寻找数据库中的频繁项集,来找出影响贷款风险分类的主要因素。
  使用数据库一条记录举例如下,该数据库表示如下:Y1,X11,X22,X31,X41,X53,X61,X72,X81则意指为:
  信用风险分类为“正常”;资产负债率=好;流动比率= 中;速动比率=好;净利润率=好;销售增长值=差;领导者素质=好;企业经济实力=中;信誉状况=好;
  我们使用C++语言实现Apriori算法,通过Apriori算法扫描前面我们构造的事实数据库,算法找出与信用风险分类最相关的五个要素为:流动比率,净利润率,销售增长值,领导者素质和企业经济实力。上面的五个指标分别体现了企业的流动性、增长性、盈利性等方面的情况,这五个指标和进行信用风险评估时所使用的经典指标是基本一致的。因此可以证明基于Apriori算法选择与信用风险相关的关键指标的方法是可行的。
  
  参考文献:
  1.(加)Jiawei Han,Micheline Kamber著.范明,孟小峰等译.数据挖掘概念与技术.北京:机械工业出版社,2001.
  2.张维,李玉霜.商业银行信用风险分析综述.管理科学学报,1998,(3):20-27.
  3.朱明,杨保安.基于知识的银行贷款分类系统.CJCAI,2001:231-235.
  4.黄娟,冯玉强,王洪伟.基于联接归纳推理的信贷风险评估集成智能系统.计算机应用研究,1999,(9):74-16.
  5.王春峰,万海晖,张维.商业银行信用风险评估及其实证研究.管理科学学报,1998,(1):68-72.
  6.(美)约翰·B·考埃特,爱德华·I·爱特曼,保罗·纳拉亚南著.石晓军等译.演进着的信用风险管理.北京:机械工业出版社,2001.
  7.李志辉.现代信用风险量化度量和管理研究.北京:中国金融出版社,2001.


Tags:
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
快速注册通道
本站部分内容来源于网络,如果有侵权等事件发生,请及时与我们联系,我们将做妥善处理
管理员 QQ:45018051 MAIL: wangnrg@hotmail.com 爱我售 爱我售-经济门户网
Copyright © 2008 i5so.com Inc. All Rights Reserved.