购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.2 SPSS数据的属性及定义方法

一个完整的SPSS数据结构包括变量名、变量类型、变量名标签、变量值标签、变量缺失值、度量尺度及数据的显示属性。度量尺度在上一节已经介绍过,本节主要介绍SPSS变量属性的定义和相关设置。

2.2.1 变量名

变量名是变量参与分析的唯一标志,定义变量结构时首先应给出每个变量的变量名。否则,系统默认为VAR00001、VAR00002、VAR00013等。变量命名要遵循如下规则。

(1)首字符必须是字母或汉字,后面可以是任意字母、数字、句点或除“!”“?”“*”“+”“-”“=”之外的任意符号。

(2)SPSS变量的变量名长度应不超过64个字符(32个汉字)。

(3)不能用下划线、句号和圆点作为变量名的最后一个字符。

(4)SPSS的变量名不能与SPSS的保留字相同。SPSS的保留字为ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH等。

(5)SPSS系统中的变量名唯一,并且不区别变量名中的大小写字符,将FAN与fan看作同一个变量。

2.2.2 变量类型及定义方法

在如图2-1所示的数据编辑器的窗口下方选择“变量视图”选项卡,单击“类型”栏下的任意一个单元,出现如图2-2所示的 按钮,单击该按钮,即可显示如图2-3所示的“变量类型”对话框。

图2-1 数据编辑器

图2-2 选择“类型”表格

图2-3 变量类型定义对话框

如图2-3所示,SPSS的变量类型共分为数字、逗号、点、科学记数法、日期、美元、定制货币、字符串、受限数字9种。

每种类型的变量都由系统给出小数位数和宽度。小数位数即该变量的显示宽度,也就是该变量所占的字节长度,总长度应包含小数点和其他分隔符。宽度是数值编辑窗口每列显示的字符位数。如果宽度小于变量的宽度,则相应列中的数据显示为需要列宽较小的科学记数法,或者显示为若干个“*”号。

下面将介绍以下几类常见变量类型的分类和定义方法。

I 数字(Numeric)

SPSS默认的数值类型。数字的系统默认宽度是8位,即整数部分+小数点+小数部分的位数,小数点默认为2位,用圆点。标准数值型变量的值用标准数值格式输出。小数点用圆点定义为标准数值格式的变量值可以用标准数值格式输入,也可以用科学记数法输入。

II 逗号(Comma)

逗号型变量用“,”表示,其值在显示时,整数部分自右向左每3位用一个逗号做分隔符,用小圆点做小数部分和整数部分的分隔符。默认长度为8位,小数为2位。例如:23,234,853.45。

III 点(Dot)

点型数据的显示方式和逗号型相反,即整数部分从个位开始每隔3位以一个圆点分隔,用逗号作为整数和小数部分的分隔符。如12.345显示为12,345,00,实际表示的是12 345E-4。不指定宽度则采用默认宽度,即8位,小数点位数为2位。定义带点的数值可以输入带点的数值,也可以输入不带点的数值,还可以用科学记数法输入。

IV 科学记数法(Scientific Notation)

科学记数法适合显示数值很大或数值很小的变量,变量值显示为指数形式。例如,2.14E+002表示为2.14×10 2 ,在数据编辑窗口中可以用以下方法输入:2.14E2、2.14D2、2.14+2、214、2.14E+2等。

美元(Dollar)

美元型变量是在逗号型变量前加上美元符号“$”的数值型变量,图2-4所示为美元型变量定义对话框。该对话框中给出了多种定义格式,用户可以根据需要选择定义格式,也可以自己定义。例如,1 234.56美元,用户可选择“$###,###.##”格式。系统默认数值宽度为8位,用户可以根据需要修改对话框中“宽度”参数选项的值,以改变变量宽度。

VI 定制货币(Custom Currency)

SPSS提供5种自定义货币数值型变量的类型,如图2-5所示。对应的自定义类型,系统自动命名为CCA、CCB、CCC、CCD、CCE型,系统默认为逗号型数值,如1 234 567.89显示为1,234,567.89。

图2-4 美元型变量定义

图2-5 定制货币型变量

用户可以通过“编辑”菜单中的“选项”选项来定义常用的数值型变量,在“选项”对话框中的“货币”选项卡中可自定义CCA、CCB、CCC、CCD、CCE的类型。

首先,单击菜单栏中的“编辑”选项,然后单击“选项”按钮,最后单击“货币”选项卡,如图2-6所示。

图2-6“货币”选项卡

以自定义CCA为例,可在“定制输出格式”选项组中单击“CCA”。然后在“所有值”中输入前后缀,在“前缀”文本框中输入数据开始字符,在“后缀”文本框中输入数据结束字符。例如,要定义人民币的输入格式,则在“前缀”文本框中输入“¥”,在“后缀”文本框中输入“元”,在定义为CCA类型的数据编辑窗口中输入“1 234”,数据显示为“¥1,234元”。

定义完所有值后,再在“负值”中定义负数的输出格式,同样包括“前缀”和“后缀”两个选项,在“前缀”文本框中输入负数数据开始字符,在“后缀”文本框中输入负数数据结束字符。

最后,在“十进制分隔符”选项组中可以定义数值部分整数和小数的分隔符,“句点”表示采用圆点作为分隔符,“逗号”表示采用逗号作为分隔符。

在“样本输出”中可以预览设置格式的显示样式。设置完毕后,依次单击“应用”按钮和“确定”按钮,设置即可生效。

CCB、CCC、CCD、CCE 4种类型数据的设置与CCA的设置方式相同,用户只需根据需要定义所有值、负值及十进制分隔符即可。

VII 日期(Date)

日期型变量是用于表示日期和时间的数量类型。SPSS提供了多达29种日期型变量的格式供用户选择,如图2-7所示。

日期型变量的值是按规定的格式输入和显示的,不能直接参与运算。如果需要日期型变量参与运算,必须先用日期函数将其进行转换后才能参与运算。日期的格式有很多种,本书仅介绍常用的几种。dd-mmm-yyyy,对应的是日日-月份-年年年年,如1-Dec-2000。dd.mm.yy,对应的是日日.月月.年年,如29.12.99。hh:mm,对应的是时时:分分,如09:59。ddd:hh:mm:ss.ss,对应的是日数:时时:分分:秒秒.百分秒,例如153:11:59:17.78。

VIII 字符串(String)

字符串型变量是非数值型变量类型,其值是由字符串组成的。字符串型变量的定义对话框如图2-8所示。

图2-7 日期型变量定义

图2-8 字符串型变量定义

字符串型变量的定义对话框中只有一个输入项“字符数”,表示输入变量字符的最大个数,系统默认为8,用户可以根据需要进行修改。字符串型变量有长短之分,字符数超过8个的字符串型变量称为长字符串型变量,等于或少于8个的称为短字符串型变量。

字符串型变量不能参与运算,而且字符串型变量的大写字母和小写字母是有区别的,系统将同一字母的大、小写认为是两个不同的字符。

2.2.3 变量标签

变量标签是对变量名和变量值的进一步解释和说明,包括变量名标签和变量值标签。

I 变量名标签

变量名标签(变量标签)是对变量名含义的进一步解释说明。因为早期版本的SPSS软件中的变量名长度限制为8个字符,有时不能清楚地说明变量的含义,新版本的SPSS中的变量名中可定义64个字符,基本能够清楚说明变量的含义。但对于特别长的变量名说明,仍需借助变量名标签。

变量名标签由不超过256个字符(或128个汉字)组成,并且可以包含空格和SPSS保留字。变量名标签是一个可选择属性,也可以不定义;同时,在统计分析结果中,一般不显示变量名标签的信息。

定义变量名标签时,在SPSS主窗口中单击左下角的“变量查看”按钮,使窗口切换至变量视窗,然后在相应变量名所在行的“标签”列添加变量名标签的内容,图2-9给出了一个定义变量名标签的示例。

图2-9 变量名标签

II 变量值标签

变量值标签(值标签)是对数值型变量各个取值的含义进行解释和说明,对于数据文件中用数值型变量表示非数值型变量时尤其有用。标签内容最多可以有120个字符。仍以图2-9中的变量为例,定义“学习前认识”这一数值型变量,取值为0、1;变量值0表示“不重要”,1表示“重要”。

变量值标签只对数值型变量、日期型变量和短字符串型变量有效,长字符串型变量(宽度超过8的字符串型变量)没有变量名标签和变量值标签的属性。

定义变量值标签时,在“变量查看”视区单击“值”列中的 按钮,则弹出定义变量值标签的对话框,如图2-10所示。

图2-10 定义变量值标签的对话框

如图2-10所示,在“值”文本框中输入变量值,在“标签”文本框中输入变量值所代表的含义,即变量值标签。然后单击“添加”按钮,下方的文本框中显示输入的变量值及其标签。输入完所有变量值标签后单击“确定”按钮,使对变量值标签的设置生效。如果输入有误,可单击文本框中显示的错误标签,然后单击“更改”按钮,修改已经输入的标签。单击“除去”按钮可删除不需要的标签。

定义完变量值标签后,在SPSS主窗口单击菜单栏中的“查看”选项,然后单击“值标签”按钮,如图2-11所示,则在SPSS主窗口中经过变量值标签定义的数值型变量显示为所定义的变量值,而不是数字。

图2-11 在主窗口定义显示变量值

2.2.4 变量缺失值

在统计分析的数据收集过程中,有时会因为某些原因产生所记录的数据失真,或者没有记录等异常情况。例如,在学生体检中,某学生的体重记录为250千克,这显然是一个失真数据,不能使用,但其他数据在分析过程中还可以使用;或在调查问卷中,被调查者没有填写调查表中必须填写的某些数据,成为缺失值。这些情况称为数据缺失或数据不完全,缺失或不完全的数据在统计分析中是不能使用的。

SPSS软件的另一特点就是可以通过指定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。在“变量查看”视区的“缺失”列单击相应变量单元格中的 按钮,打开如图2-12所示的对话框。

图2-12 定义变量缺失值的对话框

定义缺失值的对话框中包括3个选项。

(1)无缺失值:不指定缺失值。

(2)离散缺失值:对数值型或字符串型变量,用户指定缺失值为1~3个特定的离散值。

(3)范围加上一个可选的离散缺失值:选择该项,表示数值型变量缺失值定义在一个连续的闭区间和一个区间以外的离散值,“下限”和“上限”分别表示连续区间的左右端点,在“离散值”中输入区间以外的一个确定值。 O05krxW8pArzHdggEaEGiRgGoPpg/cYM88fYcm2pYxyjBcDZfFw4zadKBR+ls09T

点击中间区域
呼出菜单
上一章
目录
下一章
×