第五节 当前面临的主要问题
由于大数据拥有的众多特点,其在经济学上的应用得到了较快发展,但仍面临一些问题。主要体现在以下几个方面。
第一,经济学家对大数据的获取难。由于大数据主要由政府、互联网公司、银行等机构掌握,而在数据日益被视为重要财富、私有资源的数据时代,经济学家要获得需要的大数据资源面临着数据所有者和法律、道德的多重限制,这会影响经济学家基于大数据做研究,也是目前大量的经济研究仅依赖搜索数据这单一渠道的原因之一。要促进大数据在经济研究中的应用,解决好大数据的来源问题是至关重要的一环。
第二,经济学家对大数据的获取和处理的能力面临困境。“大数据”本身是一个从计算机领域产生的术语,经济学家真正把眼光投向大数据也是最近十几年的事情,基于大数据的研究融合了计算机、网络、信息、数学、经济学、心理学等学科的前沿知识,是一项非常复杂的研究工作,经济学家对传统的基于统计学的经济研究很擅长,但对数据挖掘、机器学习等数据处理方法普遍比较陌生,目前很多基于大数据的研究是在计算机专家的协助下开展的,这在一定程度上限制了大数据在经济学研究上的应用,经济学家从思维上转变对大数据方法是“术”的观点、掌握大数据的获取和分析技术很紧迫。唯有如此,方能真正凸显大数据的力量。
第三,基于大数据的经济分析方法的某些理论基础没有夯实。如由于大数据的数据海量,建立的经济模型存在维数很高的问题,且变量之间可能存在相关性,目前通行办法是降维,但大数据方法又不同于传统计量经济,降维的理论意义仍存在争议。对基于大数据的方法本质上是属于基于总体的方法,还是和传统样本分析方法一样等问题也存在争议。数据爆炸时代经济学家对同一经济问题会有很多种数据支撑,如何辨别、是否存在正确的数据解释也带来了一些经济概念意义上的混乱。目前基于大数据的分析主要是寻找变量间的相关性,而不是因果关系,基于大数据的经济解释能力有待进步。