SPSS数据处理与分析
上QQ阅读APP看书,第一时间看更新

第一节 案头调查与二手数据

一、案头调查

通过收集、整理和分析现存文献资料即能解决所关注问题的方法,称为案头调查(Desk Research)。这里的案头,原意是桌面。案头调查即对堆积在桌面上的纸质资料加工处理就能完成某些问题的研究方式,但当今的案头调查可以通过桌面上的计算机或移动终端将资料收集范围无限延伸,案头调查已经不只是桌面上对文件、资料、杂志等的研究了。

现存文献资料可能来源于互联网、新媒体、数据库、年鉴、图书馆、刊物、报纸、影音制品等,它们是为以前某个特定问题而收集或整理的,并不一定适合正在研究问题的目标。但通过案头调查对数据的处理,可能对解决当下的问题或多或少有一定的帮助,或提供方法指导,或提供数据支持,或提供当今项目的探索性研究。

二、二手数据

他人在以前为其他某个目的所收集整理的资料,称为二手数据(Secondary Data)。这里的数据不仅是数值呈现的资料,还包括文字陈述的资料。如果通过二手数据的收集、整理和分析,就能满足研究问题对信息的需要,当然就没有必要花费时间、精力、费用去开展实地调查收集一手数据了。以前类似的二手资料,可以为当前的研究方案提供借鉴,指导收集一手数据的调研设计,帮助确定抽样方案。

三、二手数据的收集

尽管计算机和移动终端为收集、加工和使用二手数据带来了极大的方便,但面对浩海如烟的资料,我们依然无从下手,难以快速准确地识别真正需要的信息,必须按照一定的程序方能最大限度地提高效率。笔者认为,依据以下步骤可加快二手数据搜集的进程。

第一,明确研究目的。分析希望得到什么信息,已经掌握哪些信息,还有哪些信息需要进一步搜寻。要明确地定义研究的主题,确定哪些是相关材料,哪些是与主题有关的机构及作者的名称、主要的论文。

第二,列出搜索关键词。依据研究目的,列举密切相关的中英文关键词,并在搜索过程中不断补充和完善。一般可从自己熟悉的资料篇名、作者名及其他掌握的线索入手开始搜索之旅,这样才能获得准确的资料。一些目录索引方面的杂志可能会有助于缩小相关主题的搜索范围,目标精准但资料数量有限;反之,搜索范围较为宽泛,则资料较多,获得资料的目的性较差。

第三,设定搜索条件。除了用关键词外,最好设定其他的搜索条件,如时间、刊物级别、作者等,从而使搜索到的资料比较适合所研究的目的,节省时间精力。为了提高搜索效率,起初可按“标题=关键词+相关限定条件”来搜索,要是搜索结果不够理想,再逐渐扩大搜索条件,如按“关键词=关键词+相关限定条件”搜索。总之,遵循由窄到宽、由精确到模糊、由专业到一般、由学术数据库到普通网站、由近期到远期的顺序逐渐扩大搜索范围,资料就会越来越多。

第四,评估和使用资料。将收集到的资料归类整理,并做出分析评价,明确收集的资料是否对解决问题有所帮助,然后考虑如何使用资料去论证要解决的问题。

通过二手资料的搜索,也许找到了研究项目所需要的文献资料,这无疑会大快人心;也许一无所获,这需要重新思考搜索的条件,找更专业的书籍或网站,或请教他人,或自身或雇用专业机构来开展实地调查获取一手数据。

四、二手数据的评价

对于获取的二手数据,也许初衷是为了一般性问题而收集的,也许是从某个特定问题而得到的结论,这都具有自身的目的性和适应性。因而,调研者使用前应对得到的二手数据进行审核,鉴别其准确性及可用性。通常从以下五个方面来评价二手数据。

1.权威性

显然,不同的资料来源,其可信度是不同的。调研者应该多使用国际组织、政府部门所发布的官方信息;对于其他资料来源,应明确是谁收集的,仔细鉴别其准确性和倾向性。使用资料时,要考虑机构的一贯信誉,因为各种组织、调研机构可能都有自身的观点和倾向,难免失之公正。

2.目的性

在使用以往的调查资料之前,调研者应当明确现在的调查目的与以往是否有类似性,当时为什么要收集这些数据。如果相差甚远,采用这些现成资料则需小心谨慎。一般政府公布的统计资料是针对全社会共用的,很难适合调研者某个特定问题的需要,通常需要对资料再分组。另外,各种二手数据中的统计指标口径也可能不适应现在的需要,应弄清楚原指标的定义、范围、计算方法等,掌握新变量计算的技巧与办法。

3.科学性

如果收集到的二手数据在样本选择、资料整理与数据分析中使用的方法不恰当,即使没有偏见,也不能保证资料的准确性。因此,应对现成资料的调查方法优劣做出判断,以便发现可能存在的偏差。评价的内容包括样本的大小和性质、应答率和质量、问卷设计和填写、现场工作程序、数据分析和报告。

4.时效性

过去的信息资料只能反映一定时期内的情况,不可能永远都适用。失去效用后的信息资料就成为“垃圾”,毫无价值可言。可能有些问题表面上没有发生什么变化,但事实上已有了质的不同,仍然套用这样的资料去判断就可能犯致命的错误。

5.一致性

从不同途径取得的同一主题的二手数据可能相差较大,使用前应探查造成差异的可能原因,分析各种途径获得的资料的准确性,从而决定选用哪一个途径的资料来分析论证。