SAS金融数据挖掘与建模:系统方法与案例解析
上QQ阅读APP看书,第一时间看更新

2.1 案例背景

随着人们消费观念的转变,透支和信用消费越来越被大众接受,第三方支付和信用卡业务迅速增长。欺诈、造假就如同信用的伴生品,发生率也在逐年增加,每年仅因信用卡欺诈损失金额就高达数亿,其中70%以上为伪卡、非面对面欺诈等交易类欺诈。可以说,欺诈风险防范成为信用卡以及第三方支付、消费金融等互联网金融产业共同面临的难题。

道高一尺,魔高一丈,行业不同欺诈形式也不同,而欺诈手段更是不断推陈出新,目前并没有一种通用的反欺诈技术,能够识别并防范所有的欺诈。总体而言,常用的反欺诈技术可归结为三类:

1.欺诈规则集

通过建立规则引擎或者简单的分类模型,对比欺诈行为和正常行为,归纳欺诈行为所具有的个性化特征,以规则的形式保存在欺诈规则集中。通常一个规则集有几百或上千条规则,可以看作从大量欺诈案例中提炼出来的“专家知识”,但规则集的建立是个不断积累的过程。

2.评分模型

采用机器学习算法建立复杂的分类模型,基于对大量历史数据的训练、学习,识别欺诈行为所特有的模式,对个体(申请人或交易)进行评分,综合计算欺诈概率。逻辑回归、神经网络、随机森林等是目前较为常用的算法,这些算法各有优缺点,可根据数据和业务场景进行选择。无论应用什么算法,评分模型在本质上都可看成二分类问题,根据已知“欺诈”和“正常”标签,挖掘出欺诈样例的典型特征和行为模式,注意,拥有足够多的历史数据是前提。

3.社会关系网络

适用于团伙作案的情形,构建个体关系,识别并防范欺诈团伙。与评分模型相比,这种无监督分析方式特别适用于掌握大量客户信息但又没有“欺诈”与“正常”标签的场景,例如大数据公司。

C银行信用卡中心在对欺诈风险和反欺诈技术做了充分研究之后,融合内外部数据,建立以评分模型为支撑的欺诈识别和防范系统,以满足精细化管理的需要。评分模型分为针对每个客户的欺诈评分和针对每一次交易的欺诈评分,本章着重介绍客户欺诈评分模型的构建过程。