购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.3 打开数据与录入数据

2.3.1 数据文件的导入与输出

SPSS具有强大的数据格式转换能力,为读者带来极大的方便。它可读取(访问)12种不同格式的(外部)数据文件,另存为(输出)33种不同格式的数据文件。

1.SPSS可访问的外部数据文件格式

1)SPSS Statistics(*.sav):以SPSS格式以及DOS SPSS/PC+格式保存的数据文件。

2)SPSS Statistics压缩文件(SPSS Statistics Compressed)(*.zsav):以SPSS压缩格式保存的数据文件。

3)SPSS/PC+(*.sys):SPSS/PC+数据文件,此选项只能在Windows操作系统中使用。

4)SYSTAT(*.syd,*.sys):SYSTAT的.syd、.sys数据文件。

5)便携(Portable)(*.por):以可移植格式保存的数据文件,保存该格式文件的耗时要比SPSS格式长得多。

6)Excel(*.xls,*xlsx,*.xlsm):Excel文件。

7)Lotus 1-2-3(*.w*):以Lotus 1-2-3格式(Lotus R3.0、2.0或1A)保存的数据文件。

8)SYLK(*.slk):以SYLK(符号链接)格式保存的数据文件,为某些电子表格应用程序使用的格式。

9)dBASE(*.dbf):dBASE格式文件(dBASE IV、dBASE III、dBASE III PLUS或dBASE II)。每个个案均为一条记录。用这种格式保存文件时,变量和值标签以及缺失值的设定将会丢失。

10)SAS(*.sas7bdat,*.sd7,*.sd2,*.ssd01,.ssd04,.xpt):SAS v6-9和SAS传输文件。可使用命令语法从SAS格式目录文件中读取值标签。

11)Stata(*.dta):Stata v4-8。

12)文本格式(*.txt,*.dat,*.csv,*.tab):以记事本格式保存的数据文件。

2.SPSS可储存的数据文件格式

1)SPSS Statistics(*.sav),SPSS Statistics格式:SPSS7.5之前的版本无法读取以SPSS Statistics格式保存的数据文件。SPSS 16.0之前的版本无法读取以Unicode编码格式保存的数据文件。在SPSS 10.x或11.x中使用变量名超过8B的数据文件时,将使用变量名唯一的8B版本,在SPSS 12.0或更高版本中将保留原变量名。在SPSS 10.0之前的版本中,保存数据文件时原来的长变量名会丢失。在SPSS 13.0之前的版本使用串变量超过255B的数据文件时,会将这些串变量分解为多个长度为255B的串变量。

2)SPSS Statistics压缩文件(SPSS Statistics Compressed)(*.zsav),压缩的SPSS Statistics格式:ZSAV文件和SAV文件的特征相同,但占用磁盘空间较少。只有SPSS 21.0或之后的版本可以打开.zsav文件。

3)7.0版(*.sav),7.0版格式:SPSS 7.0或之前的Windows版本可读取以7.0版格式保存的数据文件,但是不包括已定义的多响应集或Data Entry for Windows信息。

4)SPSS/PC+(*.sys),SPSS/PC+格式的数据文件:如果数据文件包含的变量超过500个,将仅保存前500个。对于具有多个用户缺失值的变量,将把其他的用户缺失值记录到第1个用户缺失值中,此格式只在Windows中使用。

5)便携(Portable)(*.por),可移植格式:SPSS的其他版本以及其他操作系统上的SPSS均可读取此格式。变量名限制为8B,必要时自动转换成唯一的8B名称。大多数情况下不再需要以便携格式保存数据,因为SPSS数据文件独立于平台/操作系统。读者无法在Unicode模式中以可移植文件来保存数据文件。

6)以制表符分隔格式(Tab-delimited)(*.dat),用制表符分隔的文本文件:在字符串中的Tab字符将会保留在制表符分隔文件中,该格式将不区分原Tab字符和分隔的Tab字符。可使用Unicode编码(Unicode encoding)或本地代码页编码(local code page encoding)保存文件。

7)以逗号分隔(Comma-delimited)(*.csv),用逗号或分号分隔的文本文件:如果当前SPSS小数指示符为句点,则用逗号分隔各值;如果当前小数指示符为逗号,则用分号分隔,可使用Unicode编码或本地代码页编码保存文件。

8)固定ASCII格式(Fixed ASCII)(*.dat),固定格式的文本文件:对所有变量使用默认写入格式,在变量字段之间没有Tab或空格,可使用Unicode编码或本地代码页编码保存文件。

9)Excel 2.1(*.xls),Microsoft Excel 2.1电子表格文件:最大变量数为256,最大行数为16 384。

10)Excel 97~2003(*.xls),Microsoft Excel 97工作表:最大变量数为256,删除超过256的变量。如果数据集包含65 356及以上个个案,则在工作表中创建多页。

11)Excel2007~2010(*.xlsx),Microsoft Excel2007的xlsx格式工作表:最大变量数为16 000;删除超过16 000的变量。如果数据集包含10 6 及以上个个案,则在工作表中创建多页。

12)1-2-3 R3.0(*.wk3),Lotus 1-2-3 V3.0电子表格文件:最大变量数为256。

13)1-2-3 R2.0(*.wk1),Lotus 1-2-3 V2.0电子表格文件:最大变量数为256。

14)1-2-3 R1.0(*.wks),Lotus 1-2-3 V1A电子表格文件:最大变量数为256。

15)SYLK(*.slk),Microsoft Excel和Multiplan电子表格文件的符号链接格式:最大变量数为256。

16)dBASEⅣ(*.dbf),dBASEⅣ格式。

17)dBASEⅢ(*.dbf),dBASEⅢ格式。

18)dBASEⅡ(*.dbf),dBASEⅡ格式。

19)SAS v6 Windows版(*.sd2),SAS V6 for Windows/OS2文件格式。

20)SAS v6 UNIX版(*.ssd01),SAS V6 for UNIX(Sun、HP、IBM)文件格式。

21)SAS v6 Alpha/OSF版(*.ssd04),Alpha/OSF(DEC UNIX)下SAS V6文件格式。

22)SAS v7+Windows短扩展名(SAS v7-8 Windows Short Extension)(*.sd7),SAS V7-8 for Windows短文件名格式。

23)SAS v7+Windows长扩展名(SAS v7-8 Windows Long Extension)(*.sas7bdat),SAS V7-8 for Windows长文件名格式。

24)SAS v7-8 UNIX版(*.sas7bdat),SAS v8 for UNIX文件格式。

25)SAS v9+Windows(*.sas7bdat),SAS v9 Windows:可以Unicode(UTF-8)或本地代码页编码保存。

26)SAS v9+UNIX(*.sas7bdat),SAS v9 for UNIX:可以Unicode(UTF-8)或本地代码页编码保存。

27)SAS传输格式(SAS Transport)(*.xpt),SAS传输格式文件。

28)Stata 4~5版(*.dta)。

29)Stata 6版(*.dta)。

30)Stata 7版(Intercooled版)(*.dta)。

31)Stata 7版(SE版)(*.dta)。

32)Stata V8 Intercooled(*.dta)。

33)Stata V8 SE(*.dta)。

2.3.2 SPSS基本操作与文件类型

SPSS的对话框中,一般有下面几个基本操作按钮。

☆【确定(OK)】:执行已选择的变量与程序。

☆【继续(Continue)】:继续进行下一步或返回到主对话框。

☆【粘贴(Paste)】:将语法粘贴到程序窗口中。

☆【重置(Reset)】:重新设置变量或程序。

☆【取消(Cancel)】:取消任何变动。

☆【帮助(Help)】:打开Microsoft Help,联机帮助,可寻找附加说明。

SPSS的文件有4种。

☆数据文件(*.sav):其数据文件内容可在数据编辑器中显示。

☆结果文件(*.spo):SPSS统计分析或作图结果,均以.spo为扩展名储存。

☆语法文件(.sps),选择对话框的选项后,SPSS将自动生成语法命令程序,单击【粘贴(Paste)】按钮,可查看其语法命令程序,执行【运行(Run)】便可得到运行结果或将视窗的语法命令程序以.sps为扩展名储存。SPSS语法文件还可以是加密语法格式.spsx。

☆脚本文件(.sbs):脚本文件可让用户调入SPSS的输出结果和运行一系列的自动化任务,包括SPSS程序的各种图形界面。

Syntax文件(*.sps)和Script文件(*.sbs)并不完全相同。Syntax文件内含命令代码,可运行统计模块和数据变换功能,而Scripts文件则允许调入输出结果(output)和其他自动化任务,如所执行的菜单和对话框的图形界面。Scripts文件中还可编写命令代码,在程序的后台直接运行统计运算和数据变换。

读者可将Scripts和Syntax文件灵活运用,可在语法命令中调入Script文件,也可在Script文件中加入语法命令。

2.3.3 数据录入示例

利用SPSS对数据进行分析,首先要建立数据文件,下面用一个实例介绍建立数据文件和录入数据的方法,并保存为02-1.sav。

【例2-1】 现有15例妇女的体检资料,见表2-1,试建立1个文件名为02-1.sav的数据文件。

表2-1 某地15例妇女的体检资料

1)变量特征分析,本例的变量(Variables)特征如下。

2)启动SPSS。选择【新建文件(New Files)】中的【新数据集(New Dataset)】,可打开SPSS数据编辑器(Data Editor),参见图2-3。

3)定义数据文件的格式,单击【变量视图(Variable View)】标签,切换到变量视图(Variable View)界面,见图2-5。

图2-5 变量视图(Variable View)界面

(1)【名称(Name)】:即变量名(variable name),应符合如下规则。

☆每个变量名必须是唯一的,不允许重复,最多可包含64B。

☆首字符必须是字母或字符@、#、$中的一个,后续字符可以是字母、数字、非标点字符和句点(.)的任意组合,但不能有空格。

☆变量名开头为#时,可将变量定义为临时变量(scratch variable),临时变量只能使用命令语法创建;开头为$表示变量为系统变量,不能作为用户定义的变量。

☆在变量名中可使用句点、下画线和字符$、#、@。例如,A._$@#1是有效的变量名,但由于句点可作为命令终止符,因此应避免使用句点结束变量名。

☆避免使用下画线结束变量名,以免与命令和过程自动创建的变量名冲突。

☆不能使用保留关键词(keyword)作变量名,如ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO和WITH。

☆可以用任意混合的大小写字符来定义变量名,大小写只用于显示的目的。

☆当长变量名需要在结果中换行为多行时,会在下画线、句点和内容从小写变为大写的位置进行换行。

(2)【类型(Type)】:单击【类型(Type)】,打开变量类型(Variable Type)对话框,见图2-6。新变量默认为数值变量。

☆【数值(Numeric)】:以标准的数值格式显示的数值变量。

☆【逗号(Comma)】:每3位用逗号分隔变量值,并以句点作为小数分隔符(decimal delimiter)的数值变量。

☆【点(Dot)】:每3位用句点分隔的变量值,并以逗号作为小数分隔符的数值变量。

☆【科学记数法(Scientific notation)】:嵌入E及带符号的10的指数形式显示的数值变量。符号可以是E或D,也可仅显示指数,如123、1.23E2、1.23D2、1.23E+2或1.23+2。

☆【日期(Date)】:可显示多种日历-日期或时钟-时间格式的数值变量。输入日期时可用斜杠(/)、连字符(-)、句点(.)、逗号(,)或空格作为分隔符,通过单击【编辑(Edit)】→【选项(Options)】→【数据(Data)】选项卡,可设定两位数年份的世纪范围。

☆【美元(Dollar)】:可显示带有前导美元符号$的数值变量,每3位用逗号分隔,并用句点作为小数分隔符,可使用标准的数字类型或带逗号、句点为小数点的数值,输入的数据值可带有或不带有前导美元符号。

☆【定制货币(Custom currency)】:可显示自定义货币格式的数值变量。可在选项(Options)对话框中的【货币(Currency)】标签中对其进行自定义。被定义的货币特征将在数据编辑器中显示。

☆【字符串(String)】:串变量(string variable)的值不是数值,因此不能用于数值计算。可在定义的长度范围内输入任意字符,并可区分字母的大小写,也可支持文字、数值混排。

☆【受限数值(具有前导零的整数)(Restricted numeric(integer with leading zeros)】:值限于非负整数的变量,显示的形式为以前导0填充达到最大变量宽度,可以以科学记数法输入值。

(3)【标签(Label)】:可设定变量标签(variable label),本例(编号)的变量标签为编号。可支持长达256个字符(128个汉字)的描述性变量标签,可包含空格及任意字符。

(4)在变量视图(Variable View)中,单击【值(Values)】,打开值标签(Value Labels)对话框,见图2-7。

图2-6 变量类型(Variable Type)对话框

图2-7 值标签(Value Labels)对话框

设定变量[文化程度]的值标签。可设定每个变量值(Value)的标签(Labels),使用代码描述非数字类型的数据(如代码1表示男性,2表示女性)。值标签将与数据文件一同保存,再次打开数据文件时不需要重新定义,值标签支持最长60个字符。长串变量(长度超过8个字符的串变量)不能设定值标签。

(5)缺失值(Missing)的设定:在变量视图(Variable View)中,单击【缺失(Missing)】,打开缺失值(Missing Values)对话框,见图2-8。

图2-8 缺失值

定义缺失值的方法有3种。

☆【没有缺失值(No missing values)】:为默认选项。

☆【离散缺失值(Discrete missing values)】:最多可定义3种类型缺失值。

☆【范围加上一个可选离散缺失值(Range plus one optional discrete missing value)】。

(6)【列(Columns)】:可用数字指定变量列的宽度,也可在数据视图中单击和拖曳列的宽度进行修改。列宽仅影响数据编辑器的显示,并不会改变变量的宽度。如果列宽小于变量的宽度,在数据视图中将显示星号(*)。

(7)【对齐(Align)】:可选择左(Left)、居中(Center)、右(Right)。

(8)【测量(Measure)】:包括度量(Scale,尺度)、有序(Ordinal)、名义(Nominal)3种测量。默认变量测量为度量(Scale,尺度)。有序测量或名义测量可为串变量、数值变量或字符数字混合型(以下简称混合型)变量。SPSS常见数据测量水平(level of measurement)的图标见表2-2。

表2-2 数据测量水平图标

自定义报表程序和图表程序可识别为尺度或分类变量,名义测量和有序测量均可视为分类变量。可选择下列3种测量水平的任何一种。

☆度量(Scale,尺度):为定距或定比的数值变量,当变量值表示有意义的有序分类时,该变量可以看作尺度(连续)变量,以便在值之间进行合适的距离比较,如年龄、收入、身高、体重等。

☆有序(Ordinal):为包含一定次序的描述性分类变量(如低、中、高,非常同意、同意、不同意、非常不同意),有序变量可为字符串(混合型)或数值,并进行明确的分类(如1=低,2=中,3=高)。

注: 对于串变量的有序测量,首字母排列的次序往往不能真正反映实际的等级分类。如一个赋值为低(low)、中(medium)、高(high)的串变量,通过首字母排序进行分类后的次序将会是高(high)、低(low)、中(medium),这并非正确的次序,一般情况下建议使用数字代码表示有序测量的数据。

☆名义(Nominal):为无序分类变量,如工作分类或公司种类。名义变量可为字符串(混合型)或有明确注解的数值(如1=男,2=女)变量。

SPSS22.0在读取SPSS8.0或之前版本的数据文件时,将根据如下规则将变量转换成相应的测量:①串变量、所有值均为缺失值的变量,少于N个唯一有效值的变量默认为名义测量;②美元或定制货币格式的变量、日期或时间(不包括月份和星期)变量、包含负值或非整数值的变量、含有N个或以上唯一有效值的变量、不包含小于10的有效值的变量默认为尺度测量。特定值N默认为24,可在选项中对特定值进行修改(单击【编辑(Edit)】→【选项(Option)】→【数据(Data)】→【读取外部数据(Reading External Data)】)。

(9)【角色(Role)】:某些对话框支持以预定义角色作为预先选择的分析变量。当打开对话框时,满足角色要求的变量将自动显示在目标列表中。

☆【输入(Input)】:变量将作为输入(如预测变量、自变量)。

☆【目标(Target)】:变量将作为输出或目标(如因变量)。

☆【两者(Both)】:变量将同时作为输入和输出。

☆【无(None)】:变量没有角色分配。

☆【分区(Partition)】:变量将把数据划分为单独的训练、检验和验证样本。

☆【拆分(Split)】:仅便于和IBM SPSS Modeler相互兼容。在SPSS Statistics中,具有此角色的变量不会用作拆分文件变量。

默认情况下,所有变量分配输入角色,包括外部文件格式的数据和SPSS 18.0之前版本的数据文件。角色分配只影响支持角色分配的对话框,对命令语法没有影响。

4)同理,可对变量[编号]、[姓名]、[文化程度]、[出生日期]、[体检日期]、[身高]、[体重]与[疾病名称]的变量特征进行定义,见图2-9。

图2-9 变量的格式

5)在变量视图(Variable View)的下方,单击【数据视图(Data View)】标签,依次输入数据,完成数据录入后,见图2-10。

图2-10 数据文件02-1.sav E/mQY7I7U3Rk0AvVB+PJe/zqllQ/dfVjwds1NvVwT+9n9mb2aChkSteMUFgvOViX

点击中间区域
呼出菜单
上一章
目录
下一章
×