前言
古之欲明德于天下者,先治其国;欲治其国者,先齐其家;欲齐其家者,先修其身;欲修其身者,先正其心;欲正其心者,先诚其意;欲诚其意者,先致其知;致知在格物。
——《礼记》
知之真切笃实处即是行,行之明觉精察处即是知。
——王阳明
大数据势不可挡。然而,对于多数公司来说,数据分析和建模能力尚未完全发展起来,虽主观意识上认同了大数据的潜在价值,也开始采集、储备数据,却不知如何才能让数据充分融入业务、帮助业务部门达成业务指标。
大数据是一种全新的业务和产品创新思维,是海量数据存储和计算的基础架构,但小数据的分析运用才是多数公司和业务领域必须关注和掌握的核心能力。本书将聚焦于实践应用,介绍数据分析、建模的方法和在业务领域的实际应用,原理和基础理论知识不是重点,因此数学公式极少,除非它比文字更能表达内容。总体上,本书不会详细罗列最热门的机器学习算法、数据挖掘方法以及人工智能,而是基于金融企业当前的实际需要,精选最具代表性的业务领域以及被广泛验证实用高效的分析建模技术,这些技术是数据分析人员必须掌握的技能。本书同时也是为掌握统计学知识和基本数据分析方法的业务专家所写,帮助他们实践、应用数据建模手段,提升对业务的引导和驾驭能力。
本书的目标读者是高级数据分析师、咨询顾问、企业内部的业务专家、高校学者和研究生,以及立志于夯实数据建模基本功,并希望不断提升的数据挖掘与数据建模人员。
内容提要
知者过之,愚者不及也;贤者过之,不肖者不及也。
——《中庸》
在学校和生活中,工作的最重要的动力是工作中的乐趣,是工作获得结果时的乐趣以及对这个结果的社会价值的认识。
——阿尔伯特·爱因斯坦
本书是一本介绍金融企业数据建模的专著。在内容上,书中以信贷(信用卡)客户的生命周期管理为主线,选取了5个在客户获取、提升、成熟和衰退环节的最经典的金融企业案例,来详细介绍最具价值与实用性的数据建模过程,每个案例既自成体系又前后呼应。
第1章介绍了数据挖掘和建模在信贷(信用卡)客户生命周期管理中的应用场景。
第2章结合信用卡客户反欺诈案例,介绍了常用的三类反欺诈手段以及欺诈评分模型的构建过程,模型采用机器学习集成算法的典范——随机森林,并给出SAS代码(各类书中绝无仅有),对回归类、决策树类、神经网络类三大类机器学习算法做了比对。
第3章结合信用卡客户精准营销案例,介绍了营销响应模型的构建、评估与应用,完整阐述从数据准备、清洗、变量粗筛选、变量压缩与转换、建模、模型评估、部署、监测与更新等模型构建过程中所涉及的操作方法。
第4章通过信用卡客户细分案例,介绍了完整的聚类过程,除快速、系统、两步聚类算法外,还详细介绍了实际分析过程中必不可少的数据预处理过程,并对聚类模型做了最完整的阐释。
第5章通过贷款违约预测案例,为零建模基础的读者提供了一个最简化的行为评分模型的构建过程,帮助零基础读者快速上手,同时简单介绍了金融企业的三大风险模型(评分卡)。
第6章结合信用卡客户流失预警与挽留案例,介绍客户价值(数值)预测与流失倾向(事件)预测两类问题的建模过程及组合应用,不拘泥于方法本身,彰显了以企业实际运用为导向的写作思路,让案例更具实用参考价值。
了解完五个案例之后,你会发现这些方法和模型在大部分业务场景中似曾相识,金融企业的数据挖掘与建模将变得易如反掌。
全书由陈春宝统稿,其中,第1、2、5、6章由陈春宝撰写,第3章由徐筱刚撰写,第4章由田建中撰写。
源代码下载
若你对书中源代码感兴趣,可与作者联系,邮箱:64346837@qq.com。