常量、变量、操作符和表达式是SPSS数据管理与操作中的基本概念,也是SPSS命令语句的重要组成部分。
SPSS中的常量是在一定阶段内其取值不随观测而改变的值。SPSS中的常量有3种类型,即数值型常量、字符型常量和日期型常量。
(1)数值型常量:数值型常量是一个数值。数值型常量有两种书写方式,一是普通书写方式(定点方式),如53、74.2等;二是科学记数法(浮点方式),使用指数表示数值,通常用于表示特别大或特别小的数值,如3.16E18表示3.16×10 18 、7.32E-15表示7.32×10 -15 等。
(2)字符型常量:字符型常量是被单引号或双引号括起来的一串字符。如果字符串中本身带有单引号或半个单引号,则该字符串常量必须使用双引号引起来,如字符串SPSS、This is Tom。
(3)日期型常量:日期型常量是按特定格式输出的日期,日期型常量一般使用较少。
对不同的对象其取值发生变化的量称为变量。SPSS中的变量也包括数值型变量、字符型变量和日期型变量3种。
(1)数值型变量:数值型变量一般由数字、分隔符和一些特殊符号(如美元符号)构成,数值型变量包含以下6种具体的形式。
标准型。标准数值型变量是SPSS中默认的数值变量格式。其默认长度为8,小数位数为2,小数采用圆点表示。标准数值型变量的变量值可用标准数值格式输入,也可以用科学记数法输入,如2378、44.21等。
逗号数值型。逗号数值型变量的整数部分从右向左每隔三位插入一个逗号作为分隔。逗号数值型变量默认长度为8,小数位数为2,小数点采用圆点表示,如7467.55。
圆点数值型。圆点数值型变量显示方式与带逗号的数值型变量相反,其整数部分从右向左每隔三位插入一个圆点作为分隔符,默认长度为8,小数位数为2,小数点采用逗号表示,如7.46755。
科学记数法型。科学记数法型数值变量的数值采用指数形式表示。科学记数法型数值变量默认长度为8,小数位数为2,通常用于表示很大或很小的数字,如3.43E+002表示3.43*102。
美元型。美元型数值型变量是在有效数字前添加美元符号的数值型变量,默认长度为8,小数位数为2,系统给出了美元型变量的多种表示形式,用户可以根据需要自行选择相应的形式,如$56 434.277。
自定义货币型。用户也可以创建5种自定义数据显示格式,系统自动将自定义数据显示名称命名为CCA、CCB、CCC、CCD和CCE,这只是5种命名,用户可以自行定制这5种类型。
(2)字符型变量:字符型变量由字符串组成,可以包含数字、字母和一些特殊符号。字符型变量的默认长度为8,大于8个字符的字符型变量称为长字符型变量,少于等于8个字符的变量称为短字符型变量,字符型变量最长为32767个字符。字符型变量不能参与运算,系统将区分大小写字母。
(3)日期型变量:日期型变量用于表示日期和时间。在如图2-2所示的“变量类型”对话框中,单击“日期”单选按钮,可以看到SPSS提供的29种不同的日期和时间格式。可根据需要选择相应的格式,如1-12-2009、29.12.99等。日期型变量不能参与运算,要想使用日期变量的值进行运算,必须通过有关的日期函数进行转换。
图2-2 “变量类型”对话框
变量名与变量标签是用户识别变量的标志,定义良好的变量名和变量标签将有助于提高分析的效率。
变量名用于区分不同的变量,SPSS中变量的命名规则如下:
SPSS变量的变量名不能超过64个字符。
首字符必须是字母、中文或特殊符号“@”“$”或“#”。
变量名中不能出现“?”“!”“-”“+”“=”“*”和“空格”。
末字符不能为“.”和“”。
名称不能与SPSS的保留字相同,SPSS的保留字有AND、BY、EQ、GE、GT、LT、NE、NOT、OR、TO、WITH和ALL。
系统不区分变量名中的大小写字母。
变量标签是对变量名和变量值的辅助说明,包括变量名标签和变量值标签两类。
变量名标签:变量名标签是对变量名的进一步解释和说明。变量名标签可由不超过256个字符的数字、汉字、字母和特殊符号构成,可以包含空格和SPSS保留字。用户可以自行设置变量名标签和变量名的显示方式,也可以用变量名标签代替变量名显示。变量名标签是一个可选择属性,用户可以不定义变量名标签。
变量值标签:变量值标签是对变量取值的进一步解释和说明,通常用于分类变量。变量值标签最大长度为120个字符,其只对数值型变量、日期型变量和短字符型变量有效,变量值标签是一个可选择属性,可不定义变量的值标签。
SPSS的基本运算有3种,即数学运算、关系运算和逻辑运算,相应的运算符及其意义如表2-1所示。
表2-1 SPSS中的运算符
将常量变量或函数用运算符进行连接,便形成了表达式,表达式的具体形式有以下3种:
算数表达式:数学运算符连接数值型的常量、变量和函数即形成算数表达式,其运算结果一般为数值,如表达式23+45,输出结果为68。
比较表达式:利用关系运算符建立两个变量间的比较关系即为比较表达式。比较表达式要求相互比较的两个量类型一致,比较表达式的结果一般为逻辑型,例如x=2,则表达式“x>0”为真,系统返回1(true)。
逻辑表达式:逻辑表达式由逻辑运算符、逻辑型的变量或取值为逻辑型的比较表达式构成,逻辑表达式的值为逻辑型常量,例如,对于表达式“true AND true”系统返回true,“true OR false”系统返回true。
在图2-1所示的数据编辑窗口中的视图转换栏选择“变量视图”标签,即输入如图2-3所示的变量视图。变量的定义就是在数据编辑器的变量视图中进行的。
(1)定义变量名:选中某个变量的“名称”单元格,直接输入变量名便可定义变量名称,输入完成后单击其他单元格或按回车键即完成设置。如果用户没有预先设置变量名称而直接在数据视图中输入数据,那么变量名称将使用系统的默认名称VAR00001、VAR00002等,用户可以双击变量名称输入变量视图修改变量名称。
(2)定义变量类型:选中某个变量的“类型”单元格,单击
按钮弹出如图2-4所示的“变量类型”对话框。在该对话框中单击相应的单选按钮即可完成变量类型的选择,具体的变量类型及其含义见2.2.1节。
(3)宽度定义:选中某个变量的“宽度”单元格,直接输入相应的数值便可定义变量宽度,可以通过
按钮来调节变量的宽度,系统默认的变量宽度为8。变量宽度的设置对日期型变量无效。
(4)小数位数定义:选中某个变量的“小数”单元格,直接输入相应的数值便可定义变量的小数位数,也可以通过
按钮来调节变量的小数位数,系统默认的小数位数为2。小数位数的设置对非数值型变量无效。
(5)变量标签定义:选中某个变量的“标签”单元格,直接输入相应的内容便可定义该变量标签。
图2-3 数据编辑器的变量视图
图2-4 “变量类型”对话框
(6)变量值标签定义:选中某个变量的“值”单元格,单击
按钮弹出如图2-5所示的“值标签”对话框。“值”文本框用于输入要定义标签的变量值,在“标签”文本框中输入定义的值标签内容,输入完成后单击“添加”按钮使设置好的值标签输入下方的列表框。单击“更改”和“删除”按钮可修改或删除设置好的值标签。
(7)缺失值的定义:选中某个变量的“缺失”单元格,单击
按钮弹出如图2-6所示的“缺失值”对话框。在该对话框中有3个可定义单选按钮。
图2-5 “值标签”对话框
图2-6 “缺失值”对话框
“无缺失值”单选按钮:表示无缺失值,为系统默认方式。
“离散缺失值”单选按钮:表示数据中存在离散缺失值,用户可以在其下的文本框中输入不超过3个的缺失值。
“范围加上一个可选的离散缺失值”单选按钮:表示数据中存在连续缺失值,在“下限”和“上限”文本框中输入相应的值以确定缺失值的取值范围。此外,用户还可以在“离散值”文本框中指定一个离散形式的缺失值。
(8)列显示宽度设置:选中某个变量的“列”单元格,直接输入相应数值便可定义列的显示宽度,可以通过
按钮来调节列的显示宽度。
(9)对齐方式设置:选中某个变量的“对齐”单元格,在其右侧出现的下拉列表框中选择相应的对齐方式即可,系统给出了“左”“右”和“居中”3种对齐方式。
(10)变量度量尺度设置:选中某个变量的“度量方式”单元格,在其右侧出现的下拉列表框中选择相应的度量尺度即可。