有时数据文件的数据量非常大,用户需要在统计分析前对数据进行有目的的选择,则可选择“数据”→“选择个案”,通过设定条件即可选出符合要求的个案,并进行相应分析。
打开数据文件,选择“数据”→“选择个案”,弹出“选择个案”对话框,如图3-40所示。其各项含义如下。
●选择:确定选择个案方法的选项栏,其中包含5个选项。
①所有个案:指所有的个案都选择,为SPSS默认选项。
②如果条件满足:指根据逻辑更新表达式选择数据,需要用户设定条件。选中此项后,激活“如果”按钮,单击该按钮,进入“选择个案:If”对话框,如图3-41所示,在右上方的窗口中输入条件表达式。
图3-40 “选择个案”对话框
图3-41 “选择个案:If”对话框
③随机个案样本:指在所有的个案中按随机抽样的方式选择个案。选择此项后,激活“样本”按钮,单击该按钮,弹出“选择个案:随机样本”对话框,如图3-42所示。其中的“大约”指按照用户给定的百分比从所有个案中随机选择个案;“正好为”指在若干个案中随机选择一定数量的个案,在后面的第一个方框中填入要选择的个案数,在第二个方框中填入选定范围的个案数。
④基于时间或个案范围:指在设定的范围内随机选择个案。选中此项后,激活“范围”按钮,单击该按钮,弹出“选择个案:范围”对话框,如图3-43所示。在两个方框中分别填入第一个个案和最后一个个案。
图3-42 “选择个案:随机样本”对话框
图3-43 “选择个案:范围”对话框
⑤使用过滤变量:指通过过滤变量来选择有效个案,将空缺个案剔除。选择此项后,激活下面的方框。选中左侧的某一个变量,单击 按钮,将该变量选入方框中。当过滤变量值为0或缺失值时,则该变量的个案将被排除在选取数据中。
●输出:确定未被选中个案的处理方法的选项栏,包括3个选项。
①过滤掉未选定的个案:选中此项后,SPSS在执行完选中个案命令后将生成一个新的变量,该变量说明了哪些是被选择的个案和哪些是未被选择的个案。未被选择的个案在数据窗口最左侧的个案序号上打上了斜线。以后的分析将只对选择的个案进行。
②将选定个案复制到新数据集:选择该选项后,激活数据集名称后面的方框,用于为新的文件命名。执行完选中个案的命令后,SPSS直接打开新生成的数据文件。
③删除未选定的个案:指执行完选择个案命令后删除未被选择的个案,即数据窗口中只保留被选中的个案。
实例八:“data03-07.sav”数据文件包括被调查者的年龄、体重、是否抽烟和是否患有慢性咽炎等信息,如图3-44所示。现要求按照不同的条件进行个案选择。
图3-44 “data03-07.sav”部分数据
(1)打开“data03-07.sav”数据文件,选择“数据”→“选择个案”,弹出如图3-40所示的“选择个案”对话框。
(2)为了让用户掌握各个选项,现根据不同条件选择个案。
①选择年龄在40岁以上的个案,并过滤掉未选定的个案。
选中“如果条件满足”,单击“如果”按钮,弹出如图3-41所示的“选择个案条件:If”对话框,在其右上方输入“年龄>40”,单击“继续”按钮回到选择个案对话框;单击选中“过滤掉未选定的个案”;单击“确定”按钮执行命令,结果如图3-45所示。
②从所有个案的60%中选择个案。
选择“随机个案样本”,单击“样本”按钮,弹出如图3-42所示的“随机样本”对话框,在其“大约”右侧的方框中输入60。单击“继续”按钮回到选择个案对话框。单击选中“过滤掉未选定的个案”;单击“确定”执行命令。结果略,其与选择“如果条件满足”相似,只是所选出来的个案是随机的。同时,每次进行相同的操作所选出的个案都不相同。
③选中第11~15个个案。
选中“基于时间或个案范围”,单击“范围”按钮,弹出如图3-43所示的“范围”对话框,在其两个方框中分别填入11、15。单击“继续”按钮回到选择个案对话框;单击选中“删除未选定的个案”;单击“确定”执行命令,结果如图3-46所示。
④选择“慢性咽炎”为过滤变量。
选择“使用过滤变量”,再选中左侧的“慢性咽炎”变量,单击 按钮,将该变量选入方框中。单击“继续”按钮回到选择个案对话框;选中“将选定个案复制到新数据集”,并命名“datenew_慢性咽炎”;单击“确定”按钮执行命令。当过滤变量为0或空缺时,相应的个案将不被选中,结果如图3-47和图3-48所示。
图3-45是“选择年龄在40岁以上的个案,并过滤掉未选定的个案”的部分结果,可以看出,“年龄>40”的被选中,且最后一列的1代表被选中。
图3-45 选择年龄在40岁以上的个案的结果
图3-46是“选中第11~15个个案”的部分结果,可以看出,除了第11~15个个案被选定并保留下来,其余的均被删除了。
图3-46 选择第11~15个个案的结果
图3-47是“选择慢性咽炎为过滤变量”的原始数据,所有“慢性咽炎”取值为0的将不被选中,而取值为1的将被选中。同时,会重新生成一个显示所有被选中个案的数据文件,名称为“datenew_慢性咽炎”,其结果显示如图3-48。
图3-47 选择“慢性咽炎”为过滤变量的原数据
图3-48 选择“慢性咽炎”为过滤变量的结果2