评估模型论文 关于评估模型论文范文参考资料

本文关于评估模型论文范文,可以做为相关论文参考文献,与写作提纲思路参考。

基于多分类器组合的个人信用评估模型

[摘 要] 本文针对个人信用评估单一模型存在的不足,提出一种基于多分类器组合的个人信用评估模型.该模型综合了多元判别分析、logistic回归、神经网络、支持向量机等七种个人信用评估单一模型的预测结果,利用加权方法对其进行组合并输出最后预测结果.在某商业银行信用卡数据集上的测试结果表明,组合模型能有效地提高预测精度及稳健性,对信贷机构控制消费信贷风险具有很好的适用性.

[关键词] 个人信用评估;多分类器组合;组合模型

[中图分类号]F224.0[文献标识码]A [文章编号]1008—1763(2011)03—0030—04

An Ensemble Credit Scoring Model Based on Multiple Classifiers

XIANG Hui,YANG Sheng gang

(College of Finance and Statistics, Hunan University, Changsha 410079, China)

Abstract:This paper proposes an ensemble credit scoring model in which the results of seven base classifiers are combined through weighted voting, The accuracy and robustness of the ensemble model are tested using 5 fold cross validation with a credit card data sets from a commercial bank. Results demonstrate that the ensemble model based on multiple classifiers is efficient and predominant in credit scoring domain.

Key words: credit scoring ,multiple classifiers,ensemble model

一、引 言

消费信贷作为一种拉动经济增长的重要手段在我国得到了迅速发展,但日益增长的信贷规模给商业银行带来了巨大的信贷风险并已经造成了大量的信贷资产损失.在此背景下,建立有效的个人信用评估模型具有重大的理论和实践意义.个人信用评估能够通过某种数量分析方法对影响个人(及其家庭)信用的主客观环境进行分析,预测出贷款申请人按期偿还贷款的概率.个人信用评估模型预测精度的微小提高也能为信贷机构挽回巨大的经济损失.目前常见的个人信用评估模型主要有多元判别分析、logistic回归、决策树、最近邻、人工神经网络和支持向量机等,每种模型在预测精度、稳健性和解释性方面有着各自的优缺点[1].

近年来,较流行的方法是将多种单一模型的分类结果进行组合,充分利用各单一模型的分类信息,提高预测的准确性和稳健性.Lee(2002)提出的组合模型是将判别分析的输出作为BP神经网络的输入单元之一,研究结果表明该方法能简化BP神经网络的结构,缩短网络训练时间以及提高模型的分类精度.石庆焱(2005)则将神经网络的输出作为logistic回归的自变量之一来构建组合模型,研究结果表明组合模型的稳定型高于神经网络模型而分类精度高于logistic回归模型.叶强(2005)和Tsai(2008)讨论了对多个神经网络模型输出结果的集成(ensemble),他们认为将多个神经网络模型的分类结果进行组合可以提高模型的分类性能[4].本文提出一种基于多分类器的组合模型构建方法,首先利用多元判别分析(MDA)、.5决策树、Logistic回归、贝叶斯网络(Bayes)、BP神经网络、RBF神经网络和支持向量机(SVM)建立个人信用评估模型,然后利用加权方法对七个模型的输出结果进行组合,这样的好处是每个模型的分类信息都得到了利用,保证了模型的稳健性,也应该能够提高模型的分类精度.因此可以预期,模型会比单独使用一种方法建立的模型要好.

二、基于多分类器组合的信用评估模型原理

(一) 基于多分类器组合的信用评估模型结构

图1为基于多分类器组合的信用评估模型结构.将多个分类器得到的分类信息进行综合, 并得出最终的分类结果,称为多分类器组合或融合(multiple classifier combination).多分类器组合模型由若干基分类器(basic classifier)组成.在接受到一个输入时,先由每个基本分类器得到各自独立的分类结果,再通过融合器将基分类器的输出结果经过处理,输出最后的组合分类结果.个人信用评估中,一个基分类器的输出形式主要有两种:1)类标号型.输出为离散值,不同的值代表不同的类别.2)度量值型.输出为连续的度量值,大小表示属于相应类的概率高低.后一种输出包含的信息较丰富,并可转换为第一种输出.由于在个人信用评估中通常将贷款申请人预测为“好”、“坏”两种类型,因此在后面的讨论中,基分类器的输出均为第一种类型.

图1 基于多分类器组合的信用评估模型结构

(二)基分类器的选择及融合

Windeatt和Terry(2005)认为,要使组合模型获得令人满意的分类性能,除了要求基分类器至少有超过50%的分类精度,还要求各个基分类器的分类模式间有较大的差异性(diversity)[5].一方面如果基分类器的精度太低,则无论分类器间的差异如何明显,组合系统的预测精度也不会增加;另一方面,如果基分类器间有相同的分类结果,则组合模型的预测精度也不会提高,反而增加了系统的复杂性.基分类器间分类模式的差异性可能来自于多方面,如采用不同的分类算法训练分类器,或在不同的特征变量集和不同的训练样本上训练分类器等.本文选取logistic回归、.5决策树、多元判别分析、BP神经网络、支持向量机,贝叶斯网络这几种采用不同算法且分类精度较高的分类器作为候选基分类器.基分类器间的差异性采用Q统计量来衡量,Q统计量定义为:Qk1k2等于ad-bcad+bc , 指在测试集中被分类器fk1和fk2都预测正确的样本数, d指在测试集中被分类器fk1和fk2都预测错误的样本数, 指在测试集中被分类器fk1预测正确但被分类器 fk2预测错误的样本数, b指在测试集中被分类器fk1预测错误但被分类器fk2预测正确的样本数.显然Q统计量取值为从-1到1间的实数,随着差异化程度的增加,Q值随之减小.

对基分类器分类结果进行融合的最简单方法就是.所有基分类器对某样本点的分类结果进行,获得票数多的分类结果为最终结果.本文采用加权方案来对基分类器的输出信息进行融合,其基本原则是给予精度高的分类器更高的权重,使每个基分类器体现自身优势.这样既可综合基分类器的分类信息,又充分考虑了不同基分类器在分类模式上的差异性.

三、实验设计及结果分析

本文采用来自某商业银行的信用卡数据集进行实证研究.该数据集有1000个样本点,包括700个"好客户"和300个"坏客户".每个样本点具有20个特征变量,包括客户性别、年龄、贷款金额、信用历史、收入状况等3个连续型变量和17个分类变量.实验前对所有的特征变量取值做了预处理,将连续型变量归一化到[0,1] ,对离散型变量则进行了重新编码.

评估模型论文范文结:

关于本文可作为相关专业评估模型论文写作研究的大学硕士与本科毕业论文评估模型论文开题报告范文和职称论文参考文献资料。

1、资产评估论文选题

2、无形资产评估论文

3、资产评估论文题目

4、论文模型

5、资产评估论文

6、建筑模型论文

论文查重免费 免费论文查重 turnitin查重 论文查重免费入口 查重最新资讯