基于大数据的经济分析
上QQ阅读APP看书,第一时间看更新

第三节 在社会科学研究中大数据的影响

近年来随着大数据的广泛应用,社会学的理论视野得到大大的拓展。同时我们要看到,在信息化社会中,将社会生活数字化、数据化、定量化,认为社会生活的本质是由信息构成的,主张用数据来测量一切,这实质是一种科学主义简化论,看待问题过于简单,作为一门多研究范式的学科,社会学采用以统计分析为特征的大数据方法,只是作为社会学诸多研究范式中的一种,是一种重要补充,但并不意味着社会学研究范式革命。

大数据驱动的社会科学研究范式具有六大特点:(1)在研究对象上,大数据研究方法使用海量样本甚至全样本数据,而传统的研究使用的是调查数据。(2)在推理逻辑上,大数据分析是采用统计学方法和数据归纳得出数学模型,而传统的研究使用根据假设系统建立的数学模型;(3)大数据分析从数据采集获取、数据建模到统计分析预测,是人设计后由计算机自动进行的,自动化程度高,而传统研究只有仿真实验这一步是自动完成,自动化程度低;(4)在可解释度上,传统研究中基于假设的建模,依据模型演绎计算结果,为理论解释提供了坚实的基础,而在大数据分析建模中,是基于算法设计的自动计算结果,其解释力较低;(5)在基础硬件设施上,传统研究仅可能涉及一台或多台计算机,而大数据分析则需要大数据平台的支撑,包括众多基础设施,比如用于自动获取数据的各种物联网传感器、计算机网络、服务器,存储器,等等。[6]

在数据驱动第四范式中,我们的研究者们将直接以真实世界为研究对象,使用真实世界所生产的海量数据,进行数据建模,运用大数据分析挖掘工具进行统计分析,进而做出预测和结果。由于当今世界进入“万物互联”时代,社会出现了“计算一切”的趋势。在这种情况下,作为社会科学研究的对象,从传统的人参与的社会系统和社会过程,转变为在现实世界和虚拟世界平行形成的数据网络。随着世界上每一个人都融入互联网活动中,网络世界将成为现实世界镜式反射,网络世界的大数据也就是成了复制现实世界的活动。每一个人的人口统计学数据、行为数据和时空数据都被记录,并能够通过大数据平台进行融合。由于互联上人们日常活动的行为记录甚至情感偏好都被记录、被分析,积累成了海量的大数据,在数据驱动的第四研究范式中,原来社科研究中数据采集的“观察渗透”问题得到很好的解决,并且海量数据通过“数据清洗”和“数据脱敏”等技术手段解决传统方法的数据质量和伦理问题。并且区别于传统的假设驱动的研究,大数据驱动的第四范式研究,将会在大数据的基础上,基于科学的大数据分析的研究方法,可能得出此前未知的理论的结论。