SPSS统计分析大全最新章节_高晶著

2.5 实用数据文件操作

数据文件输出到数据编辑器中后，就可以用SPSS的统计过程进行分析了。但有时可能由于没有按照要求取样，或需要对全部数据进行重新分类以后再处理，这样就需要对原数据文件进行编辑和转换。因此，对数据文件的操作在统计分析中占据着举足轻重的位置，这些数据文件的实际操作能使用户在使用SPSS分析数据时更加准确、高效。数据文件的编辑主要使用主菜单中的“数据”菜单和“转换”菜单。本节将重点讲解在数据文件窗口中的一些基本操作。

2.5.1 数据文件的打开与保存

打开与保存数据文件，是学习SPSS之初最基本的操作，下面进行介绍。

I 打开一个数据文件

打开数据文件的具体步骤如下。

（1）单击菜单栏“文件”选项中的“打开”按钮，或在工具栏上单击“打开文件”图标，就会打开如图2-21所示的对话框。

图2-21 “打开数据”对话框

（2）在对话框中找到需要打开的数据文件。SPSS中可以打开的数据文件主要有以下几种：*.sav，SPSS For Windows建立的数据文件；*.sys，SPSS For Windows建立的语句文件；*.xls，Excel建立的表格数据文件；*.dbf，数据库格式文件；*.sps，SPSS的语句文件。需要注意的是，并不是所有文件都可以用SPSS软件直接打开，有些文件是需要转换的，关于文件的转换将在后面进行详细讲解，此处不赘述。

（3）找到需要打开的数据文件后，可以双击文件名打开文件，也可以在选中文件后，单击对话框中的“确定”按钮。此时，屏幕会在数据窗口显示打开的数据文件中的数据。

II 保存一个数据文件

将SPSS文件保存在磁盘中，可以保存为SPSS Statistics数据文件，也可以保存为其他格式的数据文件。保存数据文件可以使用“文件”菜单中的“保存”和“另存为”命令，也可以单击菜单栏下面的保存图标来完成。

在需要保存一个数据文件时，若这个数据文件是新建的，可以单击“文件”菜单中的“保存”和“另存为”按钮，此时会打开保存文件的对话框；如果这个数据文件是已经保存过的或是从磁盘上打开的，那么单击“文件”菜单中的“保存”按钮，则将文件存到原文件的位置，单击“文件”菜单中的“另存为”按钮，会打开保存文件的对话框，可以将文件存到另一个位置。

SPSS可选择的文件类型主要有SPSS文件、固定格式的ASCⅡ文件、自由格式的ASCⅡ文件、Excel文件、dBase数据库文件、SAS文件和Stata文件。需要注意的是，数据文件格式在不同版本有不同的选择项，即使是同一种文件类型，不同版本之间也存在着兼容性问题，可能发生保存的文件在其他软件中无法打开或丢失信息的情况。

2.5.2 数据排序

对数据进行排序对于分析数据是非常重要的，SPSS中可以根据一个变量或几个变量进行排序。对数据进行排序可以通过“数据”菜单中的“个案排序”命令来实现，具体步骤如下。

（1）在菜单栏中的“数据”菜单中选择“个案排序”命令，打开如图2-22所示的“个案排序”对话框。

（2）需要根据哪个变量排序，则单击该变量，然后单击图标，该变量即被放入“排序依据”文本框。可以选择按多个变量排序。在有多个排序变量时，排序方法类似于字典的排序，可以把“排列依据”框内的第一个变量看作字母“a”，把第二个变量看作字母“b”等。当第一排序变量大小相同时，比较第二个变量；当第二个变量相同时，比较第三个变量，以此类推。

（3）在完成上一步骤后，图标将变为，如图2-23所示。此时，单击该按钮可取消已选定的排序变量。单击“粘贴”按钮可以生成操作的“语法”语句，单击“重置”按钮可取消所有已选定的排序变量，重新设置排序变量。

图2-22 “个案排序”对话框

图2-23 选定变量后的“个案排序”对话框

（4）“个案排序”框内有两种排序方式：“升序”，即按所选定的排序变量的升序来排序；“降序”，即按所选定的排序变量的降序来排序。

（5）单击“确定”按钮，即可进行排序工作。单击“取消”按钮取消操作。单击“帮助”按钮可获得该操作的帮助文档。

2.5.3 数据文件的分解

在分析数据文件的时候，可以根据用户需要对文件进行分解。所谓的文件分解，并不是要把文件分成几个，而是依据某一个或几个变量按照一定顺序把原有数据重新排列，把与所选定的一个或几个变量相关的数据在数据编辑器中集合在一起，以便集中操作和对比。

数据的分解通过“数据”菜单中的“拆分文件”来实现。首先，在菜单栏的“数据”菜单中选择“拆分文件”命令，出现如图2-24所示的对话框。

图2-24 “拆分文件”对话框

“拆分文件”对话框中有以下选项。

（1）分析所有个案，不创建组：对所有数据进行分析，不进行分组。这是系统的默认状态，在此状态下，有关分组的次一级菜单呈灰色显示，不可用。

（2）比较组：选择此项则表示将分组后的分析结果放在一起查看。在进行了分组后，分组变量将安置在同一个表格中比较输出。

（3）按组来组织输出：选择此项则表示将每一组分组分析结果单独显示出来，即每个分组变量单独输出结果。

如果需要对文件进行分组，则选择“比较组”或“按组来组织输出”，然后从左侧的变量框中选择需要进行分组的变量名，单击按钮将之输入右侧的“分组依据”框中。若选择了多个变量，分组变量的输入顺序对分组结果有影响。

“分组依据”框下面有两个选项，其中“按分组变量进行文件排序”选项表示要求对数据文件按所选择的变量进行排序，而“文件已排序”选项则表示数据文件已经按所选择的变量进行排序了。

设置完分组变量后，单击“确定”按钮，即可对数据文件进行分组。拆分后的文件将显示在数据编辑窗口中以代替原文件。

2.5.4 数据文件的合并

有时需要将几个数据文件合并在一起分析，数据文件共有两种合并方式：横向合并和纵向合并。其中，横向合并是指从外部文件中增加变量到当前数据文件中，而纵向合并是指从外部数据文件中增加观测量到当前数据文件中。

I 增加变量

增加变量有两种方式：一是从外部数据文件中获取一些变量数据加入当前数据文件中；二是按关键变量合并，例如，同一个公司内的员工的工龄和工资分别在两个数据文件中，两个数据文件有着同样的变量名称，在合并后，新的数据文件中有公司员工的工龄和工资，但使用这种方法时，两个数据文件之中一定要有一个共同的关键变量，而且这两个数据文件的关键变量中还要有一定数量的相同值的观测量。

增加变量的具体步骤如下：首先选择菜单栏“数据”菜单中的“合并文件”命令，然后选择“添加个案”命令，这时会打开如图2-25所示的对话框。

因为SPSS可以同时打开几个不同的数据文件，所以在合并数据文件时，可以直接选择已经打开的数据文件，即“打开数据集”文本框。在“外部SPSS Statistics数据文件”文本框右侧，单击“浏览”按钮可以从已经保存的SPSS数据文件中选择需要合并的文件。单击“继续”按钮进入下一步，打开如图2-26所示的对话框。

图2-25 增加变量的选择合并文件对话框

图2-26 增加变量的对话框

在增加变量的对话框中，“排除的变量”列表框中显示新合并的数据文件中不包含的变量，包括外部数据文件中和工作数据文件重名的变量列表。变量名旁标有“*”号的变量表示当前工作数据文件中的变量，带有“+”号的表示外部数据文件的变量。只有“排除的变量”列表框中重名的变量才可以作为关键变量，两个数据文件中关键变量相等的变量值是识别并且正确合并数据文件的重要依据。

如果要将“排除的变量”列表中的同名变量引入合并的数据文件，可以选择变量，然后单击“重命名”按钮，重命名变量，再选择此变量，单击按钮将其移动到“新的活动数据集”列表中。

如果两个数据文件具有相同的个案数，并且排列顺序一致，则不需要指定关键变量，只需单击“确定”按钮即可。否则，就需要选定关键变量，然后按照与关键变量相同的排序方式重新对两个数据文件进行排序。“按照排序中的关键变量匹配个案”表示按照已排序文件的关键变量匹配个案。选择该项，同时激活3个选项，其中“两个文件都匹配个案”表示对两个数据文件的全部个案进行合并；“非活动数据集为基于关键字的表”表示非活动数据文件为关键表，即将外部数据文件的变量与活动数据集中对应变量的值相等的个案合并到活动数据集中；“活动数据集为基于关键字的表”表示活动数据集为关键表，正好与上一选项相反。

合并变量后，单击“确定”按钮即可完成合并操作，并在当前数据编辑窗口显示合并后的数据文件。

II 增加观测量

增加观测量，即个案合并，也称纵向合并，是在两个具有相同变量的数据文件中，将其中一个数据文件的个案追加到当前数据文件的个案中，形成新的数据文件。

与上述增加变量的操作类似，增加观测量应在菜单栏中选择“数据”菜单中的“合并文件”命令，然后选择“添加个案”选项，打开如图2-27所示的对话框。

与增加变量相似，可以直接选择一个已经打开的数据文件，也可以从已保存的数据文件中选择。在选定了数据文件后，会打开增加观测量的对话框，如图2-28所示。

图2-27 添加个案的对话框

图2-28 增加观测量的对话框

对话框左侧的“非成对变量”列表中是未匹配的变量，右侧的“新的活动数据集中的变量”列表中是两个数据文件中文件名相同、类型相同的变量。若“非成对变量”中含有来自两个数据文件中变量名不同，但数据的含义和属性都相同的变量，可以通过“配对”命令匹配两个变量。

“指示个案源变量”选项，表示在合并的数据文件中增加一个变量名为“source01”的变量。变量值为“0”时，表示该个案来自工作数据文件；变量值为“1”时，表示该个案来自外部数据文件。

与增加变量一样，合并变量后，单击“确定”按钮即可完成合并操作并在当前数据编辑窗口显示合并后的数据文件。

2.5.5 数据文件的转置

数据文件的转置可将数据文件行（个案）、列（变量）互换，类似于矩阵转置。选择“数据”菜单中的“转置”选项后，打开如图2-29所示的对话框。

在左侧框中将要转置的变量选入右侧的“变量”框中，未被选入的变量将不会出现在新的数据文件中。如果左侧框中存在变量，这个变量的每一个值都互不相同，那么它就可以作为名称变量，名称变量的值会被转置为新变量的名称。如果不存在满足要求的变量，那么系统会自动给转置后的变量赋变量名。然后单击“确定”按钮，就可以进行转置工作。转置后的数据编辑窗口如图2-30所示。

图2-29 “转置”对话框

图2-30 转置后的数据编辑窗口

数据文件转置后，行与列互换，新数据文件的第一列为字符串型变量，变量名为“CASE_LBL”，该列的变量值为原数据文件的所有变量名。原数据文件中的个案经转置后，变成新数据文件中的变量，变量名由SPSS重新指定，形成“var00n”。但是，用户可以通过“转置”对话框中的“名称变量”来重新命名转置后所形成的新变量。

2.5.6 清除数据

我们常需要清除数据窗口的数据，以便输入新的数据。可以通过在菜单栏中选择“文件”选项，然后选择“新建”，再选择“数据”命令来清除原有的数据，开始录入新的数据。

如果数据窗口的数据在最后一次保存后改动过，那么选择“数据”命令后，会出现是否保存数据编辑窗口的对话框。如果选择“是”，则会保存数据文件；如果选择“否”，则不会保存数据文件。在做出选择后，数据窗口会被清空。

2.5.7 数据库文件的转换

许多数据文件在操作时保存在一些其他格式的数据文件中，如dBase、Foxbase、Foxpro、Orical等数据库管理系统所建立的文件。要分析此类数据文件，首先应将其转换为SPSS能够读取的文件。SPSS软件提供了多种不同格式的数据文件的读取和保存方式，甚至可以从不同格式的文本文件中方便地读取数据。另一方面，经SPSS软件处理的数据可以保存为其他格式的数据文件。

SPSS可以读取的数据文件类型主要有Excel格式文件、dBase格式文件和SAS格式文件。

I 打开一个已经存在的数据文件

直接转换的步骤：在主菜单栏中单击“文件”菜单，然后单击“打开”按钮，选择“数据”选项，打开如图2-31所示的“打开数据”对话框。

图2-31 “打开数据”对话框

在“打开数据”对话框中，单击“文件类型”栏，会弹出一个下拉框，在该框中选择要打开的文件类型。也可在查找范围内选择要打开的数据文件的位置，单击“打开”按钮，找到要打开的数据库文件后，单击“确定”按钮，即可打开目标数据库文件。

II 读取Excel格式的文件

读取其他格式的数据文件，以Excel为例。Excel的格式在数据文件中是比较常见的，SPSS软件可以直接读取Excel格式的文件。

读取Excel格式文件，可以利用上面介绍的打开数据文件的步骤，在“文件类型”下拉框中选择“Excel （*.xls、*.xlsx和*.xlsm）”选项，如图2-32所示。

图2-32 “打开数据”对话框

在如图2-32所示的对话框中，单击“打开”按钮，即可在SPSS数据编辑窗口打开此文件。

有一些格式的文件是不能被SPSS软件直接读取并显示在数据编辑窗口中的，比如文本格式的数据文件及dBase数据库中的文件等，对于这些文件，用户可以借助帮助文档或在SPSS主页上查询打开其他格式数据文件的方法。