菜鸟学SPSS数据分析
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.5.2 “双十一”交易明细分析:删除重复数据

案例:请对某超市“双十一”交易明细的数据文件进行检查,看是否有重复个案,若有请删除。原始数据如图3.5.1所示。

图3.5.1 原始数据

1.标识重复个案

打开案例文件“某超市双十一交易明细.sav”,依次单击菜单栏中的【数据】→【标识重复个案】命令。

2.标识重复个案变量设置

如图3.5.2所示,弹出【标识重复个案】对话框,将左边的所有变量都移至右边的“定义匹配个案的依据”栏中,其他选项没有特殊要求的可保持默认设置,单击【确定】按钮即完成。

图3.5.2 标识重复个案变量设置

提示:在选择多个连续变量时,可以单击首个变量,按住Shift键同时单击末尾变量,即可全部选中。

这里对对话框中一些选项的含义说明如下。

●“定义匹配个案的依据”:将此栏中的变量作为依据,若此栏中的变量取值相同,则为重复个案。

●“匹配组内的排序依据”:对重复个案的变量进行组内排序。

●“主个案指示符(1=唯一个案或主个案,0=重复个案)”:默认标签1表示没有重复个案,而标签0则表示需要标识出来的重复个案。

●“每组中的最后一个个案为主个案”:重复变量组中的最后一个个案为主要数据(本例勾选此项)。

●“每组中的第一个个案为主个案”:重复变量组中的第一个个案为主要数据。

●“每个组中的匹配个案的连续计数(0=非匹配个案)”:这里0表示没有重复的数据。

●“将匹配个案移至文件开头”:默认勾选此项,将重复个案放在整个数据的顶部,明显可见。

●“显示创建的变量的频率”:对重复的个案进行标签统计。

3.输出结果

如图3.5.3所示,在数据视图中出现一个新变量“最后一个基本个案”。

图3.5.3 输出结果

如果想要显示值标签,则可以单击菜单栏中的【查看】,勾选“值标签”,那么“最后一个基本个案”变量就会以“表示重复(0)”和“表示不同个案(1)”呈现。

4.删除重复个案

选中“最后一个基本个案”变量,单击鼠标右键,选择“升序排列”,这时就会将重复个案展现在最前面。

选中“最后一个基本个案”下变量值为0的个案,单击鼠标右键,选择“清除”,就将重复个案删除了。