购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.5 数据编辑器的基本操作

下载资源:\video\第1章\1.5

下载资源:\sample\数据2\儿童生长发育指标数据

SPSS既可以直接输入数据,也可以从多种数据源导入数据。直接输入数据时,使用的是数据编辑器。数据编辑器是SPSS的默认窗口,显示当前操作的数据文件的内容。数据编辑器分为两个视图:数据视图和变量视图。

以“儿童生长发育指标数据”为例,数据编辑器的数据视图如图1.18所示,其中每一行表示一个样本观测值,每一列表示一个变量。

图1.18 数据视图

数据编辑器的变量视图如图1.19所示,其中每一行表示一个变量,每一列表示变量的一个属性。

图1.19 变量视图

1.5.1 数据编辑器的变量视图操作

在使用数据编辑器建立或者修改数据文件时,通常先在变量视图中定义相应的变量。变量的属性包括名称、类型、宽度、小数位数、标签、值、缺失值、列、对齐、测量、角色等。

1.名称

SPSS中变量命名的规则如下:

● 不能超过64个字符。

● 首字符必须是字母、中文或特殊符号“@”“$”“#”。

● 变量名中不能出现“?”“!”“.”“+”“=”“*”和空格。

● 末字符不能为“.”和空格。

● 名称不能与SPSS的保留字(AND、BY、EQ、GE、GT、LT、NE、NOT、OR、TO、WITH和ALL)相同。

系统不区分变量名中的字母大小写。

2.类型

SPSS可以设置9种变量类型,分别是:数字、逗号、点、科学记数法、日期、美元、定制货币、字符串和受限数字(带有前导零的整数)。这9种变量类型可归为3类:数值型变量、日期型变量和字符型变量。

● 数值型变量包括:标准数值型(数字)、逗号数值型(逗号)、圆点数值型(点)、科学记数型(科学记数法)、美元数值型(美元)、定制货币数值型(定制货币)、受限数值型(带有前导零的整数)。

● 日期型变量(日期)用于表示日期或时间,主要用于时间序列分析。

● 字符型变量(字符串)区分字母大小写,但不能进行数学运算。

以y1变量为例,在如图1.20所示的变量视图中,单击变量y1行与“类型”列交叉单元格右侧的 按钮,即可弹出如图1.21所示的“变量类型”对话框。在“变量类型”对话框中,用户可以设定变量的类型。

图1.20 变量视图

图1.21 “变量类型”对话框

3.宽度

变量的宽度指在数据窗口中,变量所占的单元格列宽度。

注  意

在定义变量类型时,指定的宽度和定义变量格式的宽度有所不同。定义变量格式的宽度应当综合考虑变量宽度和变量名所占的宽度,一般取较大的值作为定义变量格式宽度时可取的最小值。

4.标签

标签是对变量名的附加说明。在许多情况下,SPSS中不超过8个字符的变量名不足以表达变量的含义。通过变量标签,可以进一步解释和说明变量的含义。特别是在Windows中文系统下,还可以添加中文标签,方便不熟悉英文的用户。例如,定义变量名为sale,可以添加标签“销售”。

给变量添加标签后,在数据编辑器窗口中操作时,当鼠标悬停在一个变量上时,变量名称下方将显示其标签。在进行统计分析时,默认输出的是变量标签而非变量名。例如,变量名sale加注了标签“销售”,则在进行描述性统计分析时,结果输出窗口中显示的是“销售”的结果,而非sale的结果。

5.值

值是对变量的可能取值的进一步说明,通常仅对分类变量的取值指定值标签。例如,对于y2变量,在如图1.20所示的变量视图中,单击变量y2行与“值”列交叉单元格右侧的 按钮,即可弹出如图1.22所示的“值标签”对话框。

例如,针对y2变量,使用1表示“男”,2表示“女”,可以在“值”文本框中输入“1”,在“标签”文本框中输入“男”,然后单击“添加”按钮;接着在“值”文本框中输入“2”,在“标签”文本框中输入“女”,然后单击“添加”按钮,完成对y2变量值标签的设置。

6.缺失值

在很多情况下,数据文件中可能出现错误,有时是由于工作失误,有时是因为数据突然出现了极端异常值。这些错误数据或极端异常值数据可能会显著干扰我们的分析,导致最终拟合的数据模型失真。例如,在调查汽车产量时,如果记录到某小型加工厂的平均日产量为600万辆,这样的高产量显然是不符合常识的,因此这个数据应属于错误的数据。如果统计分析中使用了这样的数据,必然会导致错误的分析结果。以y2变量为例,在如图1.20所示的变量视图中,单击变量y2行与“缺失”列交叉单元格右侧的 按钮,即可弹出如图1.23所示的“缺失值”对话框。

图1.22 “值标签”对话框

图1.23 “缺失值”对话框

“缺失值”对话框中共有3种处理方式供用户选择:

● 无缺失值。默认选项,如果所有的数据值测试、记录完全正确且没有遗漏,可选择此项。

● 离散缺失值。选择这种方式定义缺失值时,可以在下面的3个文本框中输入可能出现在相应变量中的缺失值,也可以少于3个。如果选择了这种处理方式,则系统在进行统计分析时,会将设置的这些值视为缺失值处理。例如,对于季节变量,如果进行了值标签操作,用1表示春季,用2表示夏季,用3表示秋季,用4表示冬季,那么若出现除1、2、3、4之外的值,则为不正确的数据。如果数据中出现了5、6、7,那么可以将这3个值输入离散缺失值下的3个文本框中。当数据文件中出现这些值时,系统将它们作为缺失值处理,确保统计分析结果的准确性。

● 范围加上一个可选离散缺失值。选择这种方式定义缺失值时,除了“下限”和“上限”文本框外,还可以在“离散值”文本框中设置范围外的值。在这种处理方式下,进行统计分析时,落在下限和上限范围内的值,以及设置的范围以外的值,都会被当作缺失值处理。例如,在统计学生体重数据时,若在“下限”文本框中输入80,在“上限”文本框中输入90,在“离散值”文本框中输入70,那么位于[80,90]区间内,以及体重为70的学生数据都会被认定为缺失值。

7.对齐

在SPSS变量视图中,变量值在单元格中的显示方式有“左”对齐、“右”对齐和“居中”3种,如图1.24所示。用户可以通过在“对齐”列中选择“左”“右”或者“居中”来决定对齐方式。默认情况下,数值型变量的对齐方式为右对齐,字符型变量的对齐方式为左对齐。

图1.24 “对齐”设置

8.测量

测量指的是变量的测量方式。变量的测量方式有3种,分别是“标度”“有序”和“名义”,如图1.25所示。

图1.25 “测量”设置

简单来说,“标度”表示连续变量,“名义”表示分类变量,“有序”表示具有顺序性质的分类变量。用户需要根据变量的实际特征来指定测量类型。例如,针对学生的身高、体重等连续性变量,应将测量方式设置为“标度”;针对学生衣服的颜色变量,可以考虑将测量方式设置为“名义”;针对银行的信贷资产(正常、关注、次级、可疑、损失)或客户满意程度(很满意、比较满意、基本满意、不满意、很不满意等),则应选择“有序”。

1.5.2 数据编辑器的数据视图操作

用户设定变量后,可进入数据视图录入或编辑样本观测值,或者对样本观测值进行必要的加工。输入数据的操作如下:单击激活选中的单元格,此时该单元格的边框加黑,单元格的颜色变为土黄色,二维表格的上方左侧显示选定单元格的观测值号和变量名;在单元格中输入的数据显示在右侧的编辑栏中;输入完成后,按回车键或向下方向键可将光标移到同列下一个单元格;按Tab键则会将光标移到右侧单元格。

注  意

输入单元格的变量值必须与事先定义的变量类型一致。如果变量为数值型,那么在单元格中输入字符串时,系统将拒绝接受;如果变量为字符串类型,在单元格中输入数值时,系统会将这个数值视为字符。

说  明

并不一定需要先设定变量再录入数据。如果用户没有设定变量,而是直接在数据视图中录入数据,SPSS会自动使用系统默认名称(VAR00001、VAR00002、VAR00003等)创建变量,如图1.26所示。

图1.26 在数据视图界面录入数据自动创建变量

这些自动创建的变量类型默认为“数字”,宽度默认为8,小数位数默认为2,标签默认无添加,值默认为“无”,缺失值默认为“无”,对齐方式默认为“右”,测量方式默认为“未知”(需要用户进行选择),角色默认为“输入”,如图1.27所示。

图1.27 自动创建变量

因此,用户也可以先在数据视图界面录入数据,再返回到变量视图界面对默认变量进行编辑,修改各项属性以符合研究要求,这样也能成功创建数据文件。

整体而言,SPSS的界面非常友好,其操作风格与Office、WPS等办公软件类似。如果用户能够熟练使用这些办公软件,就能轻松按照习惯对SPSS数据文件进行操作。 AllXAAWEd/gdyF3NyFrUeT8nYp2lN0BYAsz2meWJEP++z9P7ID1CVxoKa2QUgI+F

点击中间区域
呼出菜单
上一章
目录
下一章
×