三、征信大数据的实践
国际学术界和宏观经济政策制定者已经意识到大数据对宏观经济分析的革命性影响,将大数据的概念、方法、技术和宏观经济分析结合起来的做法正逐步得到重视。同样,征信大数据具有“全覆盖、大样本、跨周期”的特点,包含了丰富的消费者和商业机构的经济信息,除了用于做企业和个人的信用评分、反欺诈、关联分析等微观层面,还可以用于中观和宏观层面的信息服务。本书从数据挖掘、宏观经济预测和宏观经济政策评估等角度来介绍征信大数据在产业经济分析中的应用。
(一)数据挖掘
数据挖掘就是大数据时代的统计调查。目前征信中心数据库每天需要接收相关机构近1亿条数据,面对海量征信大数据,传统的统计调查方法不能适应信息收集的需要,另外,信用主体的身份、地址、职业或行业信息以及部分非银信息包含大量的非结构化文本,因此进行在数据预处理阶段时需要采取数据挖掘的技术。以本书关于中国劳动力人口迁徙研究为例,该研究不仅采用个人征信中的个人信贷、个人社保、个人公积金数据,还使用企业征信中的机构信用码、企业高管、企业贷款卡等数据,共涉及近50亿条业务数据,需要提取近200亿个数据字段,数据处理量大,数据更新快,数据种类多,只有采用数据挖掘技术才能对数量信息和文本信息进行准确快速的收集整理,得到有效结果。征信大数据背景下,应用聚类、支持向量机及向后传播(Back Propagation,BP)神经网络等数据挖掘算法使得宏观经济的分析和预测效果变得更加有效、实用。
(二)宏观经济即时预测,实时展示
征信大数据的及时和快速为实时高效的展示宏观分析预测提供了可能。利用大数据对宏观经济进行预测,最重要的应用场景就是宏观经济的实时分析和即时预测。目前对宏观经济的判断依赖于各种统计调查系统发布的统计数据,但面临的最大困难之一便在于关于宏观经济统计的数据滞后太多,基于此统计进行的预测甚至被认为助长了宏观经济波动。征信系统中每天产生大量准实时数据,为更快捷地分析宏观经济提供了可能,大数据理论与方法的发展则为即时预测提供了新的条件。以本书关于中国城市信用指数模型的研究为例,面对来源量大面广和快速更新的信用信息,研究首先利用大数据技术高效地计算出相应统计结果,然后基于层次分析法的模型的解释变量进行聚类、降维处理,验算各类变量的权重,最终分析得到各区域的信用指数,对中国各城市的信用情况进行实时评价,并利用BI技术将分析预测结果转化成动态交互图表,实时展现出来。该研究最重要的意义在于将实时、海量、快速变化的征信大数据通过宏观分析,抽象为直观的交互式图表,便于实时了解宏观分析预测结果,及时决策。
(三)宏观经济政策评估
征信大数据可以为政府的宏观经济政策制定提供数据支持,并对政策执行效果进行评估。政府在政策制定上可以通过征信大数据分析细化执行范围,强化执行效果,并作出及时调整。征信大数据长期以来为人民银行的金融统计、金融研究和宏观分析提供了基础数据支持。首先,征信大数据是金融统计的重要补充。利用大数据技术将征信数据,比如个人房贷等信息定期汇总整理,为准确有效地监测金融市场运行情况提供了数据支持。其次,征信大数据可以及时评估宏观政策。比如定向降准、二套房限贷等宏观政策的执行往往存在时滞性,而通过征信大数据可以实时跟踪政策的执行效果,并且可以监督防范违规或政策套利的行为。另外,征信大数据具有“全覆盖、大样本、跨周期”的特点,为政府的宏观经济政策制定提供了机会。比如本书关于产业结构的研究,该研究基于信贷视角回顾了近十年来我国产业结构调整路径,并分析了产业结构调整和信贷供给之间的关联性,然后用信贷发生额建立产业变动指数,对各经济区域产业间信贷资源的调整情况进行了实证分析,研究发现,信贷结构调整与产业结构调整之间存在同步性,但在调整的过程中,部分产业和部分区域缺乏足够的信贷支持力度,研究还表明利用征信大数据可以为实现我国产业结构调整和信贷资源分配提供决策支持。