3.3.1 个案合并
1.参数设置
打开第一个数据文件,选择“数据”→“合并文件”→“添加个案”,此时弹出“添加个案至”对话框,如图3-10所示,其中各选项含义如下。
(1)打开数据集:指从当前打开的数据集选择合并文件,下面显示的是当前打开的可用数据集名称,由对话框显示可知当前还打开了可用数据文件“data03-03(2).sav”。
(2)外部SPSS Statistics数据文件:指读取外部的数据文件进行合并,该项需要用户指定文件路径和文件名。
用户根据需要选择其中一种方式打开第二个数据文件即可。
单击“继续”按钮,弹出“添加个案自”对话框,如图3-11所示,其中各选项含义如下。
图3-10 “添加个案至”对话框
图3-11 “添加个案自”对话框
(1)非成对变量:该列表显示两个文件夹中不匹配的变量名,包括变量名不同的变量或变量名相同但变量定义不同的变量。显示在该列表的变量后面都有“*”或“+”,变量后带有“*”表示当前工作的数据文件中的变量,变量后带有“+”表示外部数据文件的变量。此时,可以对变量名进行更改后再选入“新的活动数据集中的变量”,操作方法为:单击“重命名”按钮,在弹出如图3-12所示的对话框中输入新名称即可。
图3-12 “重命名”对话框
(2)新的活动数据集中的变量:该列表显示合并后的新数据集所包含的变量,默认显示的是两个文件中都有的变量名。
(3)指示个案源变量:表示合并后的数据集生成一个新变量,用以表示每个个案的来源,SPSS默认0代表个案来自源文件,1代表个案来自被合并的文件。选中该复选框,则可激活下面的输入框并指定该新变量的名称,系统默认名称为“source01”。
(4)配对:该命令可以匹配来自两个数据文件中变量名不同、数据的含义和属性相同的变量。操作方法为:在“非成对变量”中选中这两个变量,激活并单击“配对”按钮,即可把强行合并后的变量选入“新的活动数据集中的变量”。
将需要在新数据文件中显示的变量选入“新的活动数据集中的变量”,未选入该列表的变量将不进行个案合并。
2.个案合并的SPSS实现
实例三:数据文件“data03-03(1).sav”与“data03-03(2).sav”分别为材料学院等7个学院、生物学院等6个学院的研究生课程信息,如图3-13所示,两个数据文件中包含相同的变量。现要求汇总所有学院的研究生课程信息,以便于后续数据分析。
图3-13 原始数据
(1)打开“data03-03(1).sav”和“data03-03(2).sav”两个数据文件。
(2)在“data03-03(1).sav”数据文件中选择“数据”→“合并文件”→“添加个案”,此时弹出如图3-10所示对话框。选择“打开数据集”中的“data03-03(2).sav”。
(3)单击“继续”按钮进入下一步,弹出如图3-11所示对话框,同时选中左侧变量列表中的“academy”和“学院”两个变量,激活并单击“配对”按钮,将两者强行合并后选入“新的活动数据集中的变量”,显示为。
(4)勾选“将个案源表示为变量”复选框,采用默认名称“source01”。
(5)为了说明一个数据文件包括的变量在合并后所呈现的结果,将只存在于一个数据文件的“课程性质”变量也选入“新的活动数据集中的变量”。
(6)完成所有设置后,单击“确定”按钮执行命令。
3.个案合并的结果分析
图3-14为合并后的部分结果。
第一列是“academy”和“学院”两个变量强行合并后所呈现的结果,因为两者仅变量名不一样,所以能顺利合并。
最后一列是“source01”变量,即表示每个个案来源,由此可以看出前部分是“data03-03(1).sav”的数据,后部分是“data03-03(2).sav”的数据。
同时,发现“课程性质”变量存在缺失值,这是因为只有“data03-03(2).sav”数据文件有“课程性质”变量,而“data03-03(1).sav”没有。
图3-14 个案合并后的部分结果
①若用户要强行合并的两个文件中的某两个变量(即两个变量来自不同的文件)仅具有相同的变量名,而变量类型不同,那么强行匹配将失败。
②合并后的数据放在当前打开的源数据文件中,保存后将直接更新此文件的内容,不可撤销;若用户希望保留源数据文件及保存合并后的数据文件,则选择“文件”→“另存为”(而非“保存”)即可。