1.2 信用评估模型介绍
谈到信用评估模型,最著名的当数美国FICO公司开发的FICO分数。FICO公司本身并不收集数据,也不是征信公司,而是为征信公司提供数据建模的技术型公司。美国最大的三家征信公司分别是TransUnion、Equifax和Experian。金融公司通常会查询借款人在至少其中一家征信公司的数据,由于各征信公司的数据多少会有所不同,有的金融公司还会把借款人在三家征信公司的数据全部查询一遍。征信公司返回的结果除了详细的历史数据,还有根据公司数据调用FICO模型生成的FICO分数。各征信公司的数据稍有不同,因此借款人在各征信公司的FICO分数也会稍有差距,但是差距一般不会很大。
FICO分数的模型计算,涉及五大类别的特征变量,这些变量分别如下。
(1)占比为35%的偿还历史特征变量。这是金融公司对借款人最关心的问题,即借款人是否按时偿还过去的账单,该项指标是FICO模型中占比最大的部分。
(2)占比为30%的欠款数额特征变量。拥有未偿还贷款或信用卡余额并不一定意味着借款人的信用风险很高。但是如果贷款余额占总收入或总的可借款上限比重太高,则意味着借款人的还款能力会下降,导致违约风险增加。
(3)占比为15%的信用历史特征变量。该变量可能包括总的信用历史、最长的借款或信用卡使用年限、最新的账户账龄和平均账户账龄等。
(4)占比为10%的信贷组合特征变量。通常,拥有更多信贷产品的借款人的违约风险更低,信贷产品包括信用卡、分期贷款、金融公司账户和房屋按揭贷款等。
(5)占比为10%的新信用申请特征变量。研究发现,近期申请大量信贷账户的借款人通常有更大的违约风险,特别是信用历史不长的借款人。
FICO分数的范围被设定在300~850分,分数越高表示信用越好。模型给出的分数实际上代表了对借款人贷款逾期概率的估计,贷款逾期率正是金融公司判断贷款是否能够盈利的核心标准。例如,某金融公司针对某款贷款产品,根据资金和其他成本的计算发现,只有所有客户的平均贷款逾期率低于2%才能盈利。这意味着,对于每个逾期的坏客户,该公司必须有其他49个以上如期还款的好客户才能保持最终的盈利。49∶1是好客户和坏客户的好坏比,又被称作比值比或优势比(odds ratio),定义如下:
一个典型的逾期率和优势比随FICO分数变化的情况如图1.2所示。
图1.2 逾期率和优势比随FICO分数变化示意图
美国征信公司Experian给出了FICO分数段和美国人群在各分数段分布的大概情况,如表1.1所示。
表1.1 美国人群在FICO分数段上的分布情况