3.3.2 变量合并
1.参数设置
(1)选择数据文件对话框的参数设置。
打开第一个数据文件,选择“数据”→“合并文件”→“添加变量”,弹出“变量添加至”对话框,如图3-15所示,此界面各选项的含义与图3-10相似,此处不再赘述。用户根据需要选择其中一种方式打开第二个数据文件即可。
图3-15 “变量添加至”对话框
(2)添加变量对话框的参数设置。
单击“继续”按钮,弹出“变量添加自”对话框,如图3-16所示,其中各项设置的含义如下。
图3-16 “添加变量”对话框
●合并方法有以下三种可选项。
①基于文件顺序的一对一合并:文件中的个案顺序决定了个案的匹配方式。
②基于键值的一对一合并:基于一个或多个变量的值匹配个案。
③基于键值的一对多合并:一个文件包含个案数据,一个文件是查找表。来自查找表的个案与个案数据文件中具有匹配键值的个案合并。相同键值在个案数据文件中可以多次出现。查找表中的一个个案可以与个案数据文件中的多个个案合并。
●排除的变量:要从新合并的数据文件中排除的变量。
①当在合并方法选项卡上选择了基于文件顺序一对一合并设置时,第二个数据集中与活动数据集中的变量同名的变量将被排除。
②当在合并方法选项卡上选择了基于文件顺序一对一合并设置时,第二个数据集中与活动数据集中的变量同名的变量将被排除。
③当在合并方法选项卡上选择了基于键值一对一合并或基于键值一对多合并设置时,排除第二个数据集中所有重复名称变量(与活动数据集中相同变量名称具有不同基本类型(字符串/数字)的变量)。
●包含的变量:要包含在新合并数据文件中的变量。如果想要在合并后数据文件中包含有重复名称的已排除变量,请使用重命名来更改名称。
①当在合并方法选项卡上选择了基于文件顺序一对一合并设置时,将包含活动数据集中的所有变量和第二个数据集中所有唯一命名的变量。
②当在合并方法选项卡上选择了基于键值一对一合并或基于键值一对多合并设置时,将包含两个数据集中所有唯一命名的变量。对于活动数据集中在第二个数据集中具有重复名称但具有不同基本类型(字符串/数字)的变量,也会包含在内。
●键变量:对于键值合并,基于键变量值合并个案。
①当在合并方法选项卡上选择了基于文件顺序一对一合并设置时,将包含活动数据集中的所有变量和第二个数据集中所有唯一命名的变量。
②当在合并方法选项卡上选择了基于键值一对一合并或基于键值一对多合并设置时,将包含两个数据集中所有唯一命名的变量。对于活动数据集中在第二个数据集中具有重复名称但具有不同基本类型(字符串/数字)的变量,也会包含在内。
●“在合并前按键值对文件进行排序”复选框:勾选复选框后激活该对话框。
用户在合并变量时,若两个数据文件没有共同的变量,此时不需指定键变量,直接将所需合并的变量选入“新的活动数据集”,即可按观测量出现的顺序一对一地合并。
若两个数据文件拥有相同的变量,也有不同的变量,此时可以将相同的变量指定为键变量,并指定当键变量值不同时的观测量处理方法。
2.变量合并的SPSS实现
实例四:“data03-04(1).sav”与“data03-04(2).sav”分别为课程信息和任课教师信息,如图3-17所示,其中“data03-04(1).sav”缺少“课程编号”为2和3的个案,“data03-04(2).sav” 缺少“课程编号”为8和9的个案。现要求将后者中的部分变量合并到前者中,并使用三种方式处理键变量值相同时的观测量。
图3-17 原始数据
●第一种方式:选择“基于键值一对一合并”选项。
(1)打开“data03-04(1).sav”,选择“数据”→“合并文件”→“添加变量”,弹出如图3-15所示对话框,选择“打开数据集”中的“data03-04(2).sav”。
(2)单击“继续”按钮进入下一步,弹出如图3-18所示“变量添加”对话框。勾选“基于键值的一对一合并”和“在合并前按键值对文件进行排序”复选框,在“排除的变量”列表中选中“课程编号”,然后单击下面的按钮,将“课程编号”变量选入“键变量”列表中。
(3)单击“确定”按钮,完成了变量合并,如图3-19(a)所示。
图3-18 变量添加对话框
●第二种方式:选择“基于文件顺序的一对一合并”选项。
在图3-16对话框中选择并勾选“基于文件顺序的一对一合并”,其余步骤与第一种方式相同,结果如图3-19(b)所示。
●第三种方式:选择“基于键值的一对多合并”选项。
在图3-16对话框中选择“基于键值的一对多合并”,选择查找表勾选“数据集2”,其余步骤与第一种方式相同,结果如图3-19(c)所示。
3.变量合并的结果分析
图3-19(a)、(b)、(c)是分别选择“基于键值的一对一合并”“基于文件顺序的一对一合并”和“基于键值的一对多合并”选项处理键变量值相同时的观测量的合并结果。
我们知道,“data03-04(1).sav”缺少“课程编号”为2和3的个案,“data03-04(2).sav”缺少“课程编号”为8和9的个案,所以,图3-19(a)中个案8和9缺失“任课教师职称”和“任课教师所在学科”的观测量,个案2和3缺失“学时”和“学分”的观测量;图3-19(b)中个案2和3缺失“学时”“学分”和“课程性质”的观测量;图3-19(c)中个案8和9缺失“任课教师职称”和“任课教师所在学科”的观测量。
图3-19 变量合并的部分结果
①键变量中不能有“”这样的缺失值,否则系统会以为键变量的排序是按照降序排列而非升序排列,导致无法完成变量合并。
②合并后的数据放在当前打开的源数据文件“data03-04(1).sav”中,保存后将直接更新此文件的内容,不可撤销;若用户希望保留源数据文件及保存合并后的数据文件,则选择“文件”→“另存为”(而非“保存”)即可。