3.5.2 “双十一”交易明细分析:删除重复数据
案例:请对某超市“双十一”交易明细的数据文件进行检查,看是否有重复个案,若有请删除。原始数据如图3.5.1所示。
图3.5.1 原始数据
1.标识重复个案
打开案例文件“某超市双十一交易明细.sav”,依次单击菜单栏中的【数据】→【标识重复个案】命令。
2.标识重复个案变量设置
如图3.5.2所示,弹出【标识重复个案】对话框,将左边的所有变量都移至右边的“定义匹配个案的依据”栏中,其他选项没有特殊要求的可保持默认设置,单击【确定】按钮即完成。
图3.5.2 标识重复个案变量设置
提示:在选择多个连续变量时,可以单击首个变量,按住Shift键同时单击末尾变量,即可全部选中。
这里对对话框中一些选项的含义说明如下。
●“定义匹配个案的依据”:将此栏中的变量作为依据,若此栏中的变量取值相同,则为重复个案。
●“匹配组内的排序依据”:对重复个案的变量进行组内排序。
●“主个案指示符(1=唯一个案或主个案,0=重复个案)”:默认标签1表示没有重复个案,而标签0则表示需要标识出来的重复个案。
●“每组中的最后一个个案为主个案”:重复变量组中的最后一个个案为主要数据(本例勾选此项)。
●“每组中的第一个个案为主个案”:重复变量组中的第一个个案为主要数据。
●“每个组中的匹配个案的连续计数(0=非匹配个案)”:这里0表示没有重复的数据。
●“将匹配个案移至文件开头”:默认勾选此项,将重复个案放在整个数据的顶部,明显可见。
●“显示创建的变量的频率”:对重复的个案进行标签统计。
3.输出结果
如图3.5.3所示,在数据视图中出现一个新变量“最后一个基本个案”。
图3.5.3 输出结果
如果想要显示值标签,则可以单击菜单栏中的【查看】,勾选“值标签”,那么“最后一个基本个案”变量就会以“表示重复(0)”和“表示不同个案(1)”呈现。
4.删除重复个案
选中“最后一个基本个案”变量,单击鼠标右键,选择“升序排列”,这时就会将重复个案展现在最前面。
选中“最后一个基本个案”下变量值为0的个案,单击鼠标右键,选择“清除”,就将重复个案删除了。