购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.1 数据类型及定义

数据是统计分析的基础,用户在进行分析之前,需要区分不同的数据类型,同时,掌握定义变量的方法。

视频文件:视频文件\Chapter02\定义变量.avi

2.1.1 数据类型

数据包括常量和变量。常量指取值在一定阶段保存不变的量,如圆周率,SPSS中的常量包括数值型、字符型和日期型;变量指在不同的记录行取不同的值,即取值可变的量。

2.1.2 定义变量

输入数据前首先要定义变量。定义变量即要定义变量名、变量类型、变量宽度、小数位数、变量标签、变量值标签和变量的格式等。

说明

变量的定义在“变量视图”窗口进行,每一行表示一个变量的定义信息。

1.定义变量名

SPSS默认的变量名为VAR00001、VAR00002等,用户可以根据自己的需要对变量进行命名。变量的命名有一定的规则,具体内容如下:

(1)必须以字母、汉字或字符@开头,其他字符可以是任何字母、数字或_、#、$等符号。

(2)不能使用空白字符和其他特殊字符(如“!”、“?”等)。

(3)变量命名不区分大小写且必须唯一。

(4)用户定义的变量不能以“$”为首写。以“$”为首写的变量名特指SPSS的系统变量,它不可修改,而且在程序中不可用。

(5)避免最后一个字符是“.”,因为英文句点有时会作为命令的结束标志,若这样定义变量,则容易引起歧义。

(6)避免最后一个字符是“_”,因为下画线一般作为由程序或命令自动生成的变量名的结尾。

(7)SPSS的保留字不能作为变量的名称,SPSS的保留字有ALL、AND、WITH、NOT、OR、BY、EQ、GE、GT、LE、LT、NE、TO。若使用了上述保留字作为变量名,系统会自动提示。

2.定义变量类型

单击“类型”相应的单元格中的按钮 ,弹出“变量类型”对话框,如图2-1所示,在对话框中选择合适的变量类型并单击“确定”按钮,即可定义变量类型。

图2-1 “变量类型”对话框

SPSS 22.0的变量类型包括数值型、字符串型、日期型,具体介绍如下。

(1)数值型变量。

数值型变量的长度是用字符个数度量的数字宽度,小数点和其他分界符也计算在内,常用的数值型变量如下。

● 数值:可以定义数值的宽度和小数位数,SPSS默认位数分别为8、2。数值的宽度包括整数部分+小数点+小数部分的位数。

● 逗号:指整数部分每3位数添加一个逗号,如“1,234.00”。其余定义方式同数值型。

● 点:以整数形式显示,每3位数加一点(这里不是小数点)。可以定义小数位数,但所显示的小数部分均为0,且小数点用逗号表示。如自定义小数位数为2,则“9.8765”显示为“98.765,00”。

● 科学计数法:指数值在数据窗口中以指数形式显示。如定义数值宽度为8,小数位数为3,则“123.456”显示为1.23E+02。

● 美元:SPSS 提供了多种货币显示形式,用户可根据需要选择,并定义数据宽度和小数位数。其值在显示时,有效数字前面带有“$”,输入时可以不输入“$”,显示时系统会自动加上“$”和分隔符。

● 定制货币:默认显示为整数部分每3位加一个逗号,用户可以定义数据宽度和小数位数。如9876543.21显示为9,876,543.21。

● 受限数值型:指输入的数值位数限制为所设定的数据宽度。假定数据宽度设为4,则“112233”显示为“2233”,而“11”显示为“0011”。

(2)字符型变量。

用户自定义字符长度以便输入字符,使用时需注意以下几个方面:

● SPSS区分短字符串和长字符串,短字符串最长8字节,一个长字符串大于等于8字节,长字符串变量不能定义用户缺失值。有些分析过程可以处理短字符串,但不能处理长字符串。

● 系统缺失值不能用于生成字符串变量。

● 当生成新变量、修改原变量时,可能产生缺失值或未定义的变量值,这时系统自动赋予值为空。变量值以空格表示时,若无特别定义,不能代表缺失值。

● 字符型变量不能参与算术运算。

● 字符串中的大小写字母是截然不同的两个字符,用户在使用时需注意。

(3)日期型变量。

SPSS中的日期型变量既可以表示日期,也可以表示时间。SPSS提供了多种日期显示形式,用户可根据需要选择。

3.定义变量宽度

系统默认宽度为8。单击宽度列中的某一单元格,将出现 图标,单击上下箭头可调大调小变量的宽度。也可直接在单元格里输入数字。当变量类型为日期型时,变量长度的设定无效。

4.定义变量小数

设置变量的小数位数,方法同变量宽度的设置。当变量类型为日期型时,变量小数位数的设定无效。

5.定义变量标签

变量标签是对变量名的进一步描述,其可以输入120个字符,且可显示大小写。变量标签可以显示在输出窗口,便于查看结果时理解变量的实际意义。

6.定义变量值标签

变量值标签是对变量的每一个可能取值的进一步描述,当变量是定性或定序变量时,变量值标签的描述是非常管用的。

例如,在统计分析中经常用1代表“男”,2代表“女”等。具体操作为:单击“值”相应的单元格右侧的 ,弹出“值标签”对话框,如图2-2所示;在“值”中输入1,“标签”中输入男;单击 按钮即完成变量值标签的添加。

注意

若要对已经设置好的值标签进行修改,只需选中该值标签,在值和标签列中进行修改后单击 按钮即可。若要删除值标签,则选择该值标签,单击 按钮即可。

7.定义缺失值

SPSS有两类缺失值:系统缺失值和用户缺失值,系统默认为无。在实际工作中常会因为某种原因出现记录数据失真、没有记录等缺失现象。

例如在统计过程中,一些被调查者没有回答的题目都将标为用户缺失值。定义缺失值的具体操作为:单击“缺失”下面的某一单元格,弹出“缺失值”对话框,如图2-3所示,其中有以下三种定义缺失值的方法:

● 没有缺失值,SPSS默认方式。若当前变量的取值完整,则选择此项;

● 离散缺失值,可以指定1~3个离散的缺失值。例如指定20、95和88为缺失值;

● 范围加上一个可选离散缺失值,可以指定一个缺失值范围和一个离散的缺失值。

图2-2 “值标签”对话框

图2-3 “缺失值”对话框

8.定义变量的显示宽度

SPSS默认为8。用户可根据需要进行设置。

9.定义变量显示的对齐方式

有左对齐、右对齐、居中对齐三种方式,SPSS默认为右对齐。

10.定义变量的测量尺度

可选测量方式有以下3种:

● 名义:一种分类变量,即它的取值只代表观测对象的不同类别,变量的取值之间没有内在的大小可比性。例如“性别”变量。

● 有序:一种分类变量,但是变量取值之间有内在的大小顺序或等级。例如“满意度”变量的取值为1-很不满意、2-比较满意、3-非常满意,由小到大的取值代表满意度的提高。

● 度量:又称定距变量或刻度变量,一般为有刻度度量的连续变量,它的取值之间可以比较大小,且可以定义距离。例如“年龄”、“年份”等。

11.定义变量的角色

用于定义变量在后续统计分析中的功能作用,SPSS提供的角色选项有输入、目标、两者、无、分区和拆分。

技巧

如果有多个变量的类型相同,可以先定义一个变量,然后把该变量的定义信息复制给新变量。具体操作为:先定义好一个变量,在该变量的行号上单击右键,在弹出的快捷菜单中选择“复制”命令,然后选择其他同类型所在行,单击鼠标右键,在弹出的快捷菜单中选择“粘贴”即可。

2.1.3 操作符与表达式

SPSS的基本运算有3种:数学运算、关系运算和逻辑运算。对应的操作符表示方法如表2-1所示。

数学运算符也就是常用的算术运算符,可以连接数值型的常量、变量和函数,形成算术表达式,运算结果通常为数值。运算符的优先级为:括号>函数>乘方(幂)>乘或除>加或减,同一优先级的符号,位于左侧的优先级高。

表2-1 操作符表

关系运算符用于建立两个量之间的比较关系,如果比较关系成立,则关系表达式的值为真(true),否则为假(false)。例如,假定表达式为“a<0”,那么如果a=1,则表达式“a<0”为假,表达式的值为0(假);如果a=-1,那么表达式“a<0”为真,表达式的值为1(真)。

在表2-1中,关系运算符和逻辑运算符均有两种表达方法,括号中的关系运算符与括号前的是等价的。

注意

相互比较的两个量的类型必须一致,无论进行比较的两个量是字符型还是数值型,比较的结果均是逻辑型。

逻辑运算符、逻辑型变量或值为逻辑型的表达式(如关系表达式)都称为逻辑表达式,逻辑表达式的值为逻辑型(true或false)。逻辑运算规则如表2-2所示。

表2-2 逻辑运算规则 bEPl/ddoRtipsrx87gznIbhXwY+q9aUIkPapy5n6/NfqO+S9+ctF9QX76BUnk240

点击中间区域
呼出菜单
上一章
目录
下一章
×