购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.6 数据类型及定义

数据是统计分析的基础,用户在进行分析之前,需要区分不同的数据类型,同时掌握定义变量的方法。

1.6.1 数据类型与变量定义

数据包括常量和变量。常量指取值在一定阶段保持不变的量,如圆周率,SPSS中的常量分为数值型、字符串型和日期型;变量指在不同的记录行取不同的值,即取值可变的量。

输入数据前首先要定义变量,定义变量时要定义变量名、变量类型、变量宽度、变量小数位数、变量标签、变量值标签和变量的显示宽度等。

1.定义变量名

SPSS默认的变量名为VAR00001、VAR00002等,用户可以根据自己的需要对变量进行命名。变量的命名有一定的规则,具体内容如下。

(1)必须以字母、汉字或字符@开头,其他字符可以是任何字母、数字或_、#、$等符号。

(2)不能使用空白字符和其他特殊字符(如“!”“?”等)。

(3)变量命名不区分大小写且必须唯一。

(4)用户定义的变量不能以“$”开头。以“$”开头的变量名特指SPSS的系统变量,系统变量不可修改,而且在程序中不可用。

(5)避免最后一个字符是“.”,因为英文句点有时会作为命令的结束标志,若这样定义变量,则容易引起歧义。

(6)避免最后一个字符是“_”,因为下画线一般作为由程序或命令自动生成的变量名的结尾。

(7)SPSS的保留字不能作为变量名,SPSS的保留字有ALL、AND、WITH、NOT、OR、BY、EQ、GE、GT、LE、LT、NE、TO等。若使用了上述保留字作为变量名,系统会自动提示。

2.定义变量类型

单击“类型”相应的单元格中的按钮 ,弹出“变量类型”对话框,如图1-6所示,在该对话框中选择合适的变量类型并单击“确定”按钮,即可定义变量类型。

图1-6 “变量类型”对话框

SPSS 28.0的变量类型包括数值型、字符串型、日期型,具体介绍如下。

(1)数值型变量

数值型变量的长度是用字符个数度量的数字宽度,小数点和其他分界符也计算在内,常用的数值型变量表示方法如下。

● 数字:可以定义数值的宽度和小数位数,SPSS默认宽度和小数位数分别为8、2。数值的宽度包括整数部分的位数、小数点、小数部分的位数。

● 逗号:指整数部分每3位数添加一个逗号,如“1,234.00”。

● 点:以整数形式显示的数值每3位数加一点(这里不是小数点)。也可以定义小数位数,但所显示的小数部分均为0,且小数点用逗号表示。如自定义小数位数为2,则“9.8765”显示为“98.765,00”。

● 科学记数法:指数值在数据编辑窗口中以指数形式显示。如定义数值宽度为8,小数位数为3,则“123.456”显示为1.23E+02。

● 美元:其值在显示时,有效数字前面带有“$”,输入时可以不输入“$”,显示时系统会自动加上“$”和分隔符。

● 定制货币:SPSS提供了多种货币显示形式,用户可根据需要选择,并定义数据宽度和小数位数。默认显示为整数部分每3位加一个逗号,用户可以定义数据宽度和小数位数,如9876543.21显示为9,876,543.21。

● 受限数字:指将输入的数值位数限制为所设定的数据宽度。假定数据宽度设定为4,则“112233”显示为“2233”,而“11”显示为“0011”。

(2)字符串型变量

用户可自定义字符串长度以便输入字符串,使用字符串时需注意以下几个方面。

● SPSS区分短字符串和长字符串,短字符串最长为8字节,一个长字符串大于等于8字节,长字符串变量不能定义用户缺失值。有些分析过程可以处理短字符串,但不能处理长字符串。

● 系统缺失值不能用于生成字符串型变量。

● 当生成新变量、修改原变量时,可能产生缺失值或未定义的变量值,这时系统自动赋予值为空。变量值以空格表示时,若无特别定义,不能代表缺失值。

● 字符串型变量不能参与算术运算。

● 字符串中的大小写字母是截然不同的两个字符,用户在使用时需注意。

(3)日期型变量

SPSS中的日期型变量既可以表示日期,也可以表示时间。SPSS提供了多种日期显示形式,用户可根据需要选择。

3.定义变量宽度

系统默认变量宽度为8。单击“宽度”列中的某一单元格,将出现 图标,可单击上/下箭头调大/调小变量的宽度,也可直接在单元格里输入数字。当变量类型为日期型时,变量宽度的设定无效。

4.定义变量小数位数

设置变量的小数位数,方法同变量宽度的设置方法。当变量类型为日期型时,变量小数位数的设定无效。

5.定义变量标签

变量标签是对变量名的进一步描述,最多包括120个字符,且区分大小写。变量标签可以显示在结果输出窗口,便于查看结果时理解变量的实际意义。

6.定义变量值标签

变量值标签是对变量的每一个可能取值的进一步描述,当变量是定性变量或定序变量时,变量值标签的描述是非常有用的。

例如,在统计分析中经常用1代表“男”、2代表“女”等。具体操作为:单击“值”相应的单元格右侧的 ,弹出“值标签”对话框,如图1-7所示;在“值”中输入1,“标签”中输入男;单击“添加”按钮即完成变量值标签的定义。

图1-7 “值标签”对话框

7.定义缺失值

SPSS有两类缺失值,即系统缺失值和用户缺失值,系统缺失值默认为无。在实际工作中常会因为某种原因出现记录数据失真、没有记录等缺失现象。例如在统计过程中,一些被调查者没有回答的题目都将标记为用户缺失值。

定义缺失值的具体操作为:单击“缺失”列下面的某一单元格,弹出“缺失值”对话框,如图1-8所示,其中有以下3种定义缺失值的方法。

图1-8 “缺失值”对话框

● 无缺失值:SPSS默认方式。若当前变量的取值完整,则选择此项。

● 离散缺失值:可以指定1~3个离散的缺失值。例如可指定20、95和88为缺失值。

● 范围加上一个可选的离散缺失值:可以指定一个缺失值范围和一个离散的缺失值。

8.定义变量的显示宽度

SPSS默认变量的显示宽度为8,用户可根据需要进行设置。

9.定义变量显示的对齐方式

SPSS有左对齐、右对齐、居中对齐3种方式,默认为右对齐。

10.定义变量的测量尺度

SPSS可选测量尺度有以下3种。

● 名义:一种分类变量,即它的取值只代表观测对象的不同类别,变量的取值之间没有内在的大小可比性。例如“性别”变量。

● 有序:一种分类变量,但是变量取值之间有内在的大小顺序或等级。例如“满意度”变量的取值为1表示很不满意、2表示比较满意、3表示非常满意,由小到大的取值代表满意度的提高。

● 度量:又称定距变量或刻度变量,一般为有刻度度量的连续变量,它的取值之间可以比较大小,且可以定义距离。例如“年龄”“年份”等。

11.定义变量的角色

角色用于定义变量在后续统计分析中的功能,SPSS提供的角色选项有输入、目标、两者、无、分区和拆分等。

1.6.2 运算符与表达式

SPSS的基本运算有3种:数学运算、关系运算和逻辑运算。对应的运算符表示方法如表1-1所示。

表1-1 运算符

数学运算符也就是常用的算术运算符,可以连接数值型的常量、变量和函数,形成算术表达式,运算结果通常为数值。数学运算符的优先级从高到低为括号、函数、乘方(幂)、乘或除、加或减,同一优先级的符号,位于左侧的优先级高。

关系运算符用于建立两个量之间的比较关系,如果比较关系成立,则关系表达式的值为真(true),否则为假(false)。例如,假定表达式为“a<0”,如果a=1,则表达式“a<0”为假,表达式的值为0(假);如果a=−1,那么表达式“a<0”为真,表达式的值为1(真)。

在表1-1中,关系运算符和逻辑运算符均有两种表达方法,括号中的运算符与括号外的是等价的。

逻辑运算符、逻辑型变量或值为逻辑型的表达式(如关系表达式)都称为逻辑表达式,逻辑表达式的值为true或false。逻辑运算规则如表1-2所示。

表1-2 逻辑运算规则 bliRXbJObcsM0x2nSwNi+C6uyCz2l3AM8pUI9SivuDy4E4M8HnUxEeL/UnWmBCnZ

点击中间区域
呼出菜单
上一章
目录
下一章
×