在分析处理数据时,有时需要输出一系列含有多种统计量的报表,从而获取一些有价值的信息,以便做更深的分析。
SPSS的所有统计结果都会以表格的形式输出在结果浏览窗口,但这里介绍的是比统计分析结果更简单明确的数据报表。SPSS的报告功能是以表格的形式,按照一定的要求将数据做成列表以表现数据内在的联系,让用户在进行具体分析之前先大致了解数据之间的内在联系,以便更准确地确认进一步分析应使用的工具。
运用报告功能可以得到许多统计学的基本指标,如平均数、方差、标准差、极大值、极小值、偏度、峰度及标准误差等,还能进行常态性检验、独立性检验等检验单变量的特征及多变量之间的相互关系,还可以按照用户规定的格式输出报表。
在线分析处理报告(OLAP,Online Analytical Processing),该过程对于按一个或多个分组变量所分的组,计算所考察的连续变量的总体值、均值及其他基本统计量,并且以分层的方式输出结果,表中每一层依据一个分组变量的结果输出。
在建立或打开一个数据文件后,就可进行在线分析处理了。
打开数据文件后,打开“OLAP立方体”对话框。在主菜单栏中选择“分析”菜单,选择“报告”选项,然后单击“OLAP立方体”按钮,打开如图3-1所示的对话框。
图3-1 “OLAP立方体”对话框
如图3-1所示,“OLAP立方体”对话框的左边为所有变量,右边包含两个文本框,即“摘要变量”文本框和“分组变量”文本框。
进入“摘要变量”文本框中的变量需要是数值变量,SPSS程序将自动对该框中的变量做摘要分析。从左侧的源变量框中,选择取值有限的数值型或字符串型变量作为分组变量进入“分组变量”文本框,SPSS程序将自动按照每个分组变量的类别进行摘要分析。
需要说明的是,这里的分组变量在实际的运算过程中并不起到分组的作用,仅仅是确定进入统计过程的观测量的范围。仍然以“职工数据”数据文件为例,选择“基本工资”作为摘要变量,将“文化程度”作为分组变量,计算学历的平均工资水平,那么在输出结果中显示的并不是每个学历的平均工资水平,而是所有属于观测量的工资的总平均值。
在主对话框中选择了摘要变量和分组变量后,单击“统计”按钮,打开如图3-2所示的对话框,在该对话框中可以选择要输出的统计量。
如图3-2所示,对话框中可供选择的统计量有总和、个案数、平均值、中位数、分组中位数、平均值标准误差、最小值、最大值、范围、标准差、方差、峰度、峰度标准误差、偏度、偏度标准误差、第一个、最后一个、在总和中所占的百分比、在总个案数中所占的百分比、几何平均值、调和平均值等。
图3-2 “OLAP立方体:统计”对话框
系统默认的需要分析的统计量包括总和、个案数、平均值、标准差、在总和中所占的百分比、在总个案数中所占的百分比,用户可以根据自己的需要选择添加或删除一些统计量。
在“OLAP立方体:统计”对话框中单击“帮助”按钮,可得到相关的帮助文档。在选择完需要分析的统计量后,单击“继续”按钮,回到如图3-1所示的“OLAP立方体”主对话框中,单击“确定”按钮即可进行相关的摘要分析。
下面以“职工数据.sav”数据文件为例做简单的在线分析。
首先,在菜单栏中选择“报告”菜单,然后单击“OLAP立方体”按钮,打开“OLAP立方体”对话框,如图3-1所示。
然后选择“基本工资”作为摘要变量,“文化程度”作为分组变量。单击“统计”按钮进入如图3-2所示的对话框。
这里仅选择“总和”“平均值”和“标准差”3个统计量做简单示例分析。在“OLAP立方体:统计”对话框中将不需要的统计量从“单元格统计”文本框中移出。操作方法为单击要移出的统计量,然后单击
按钮即可。
选择完需要分析的统计量后,单击“继续”按钮回到如图3-1所示的“OLAP立方体”对话框,然后单击“确定”按钮即可完成操作。系统将自动进行相关的摘要分析,分析结果输出窗口如图3-3所示。在图3-3所示的分析结果输出窗口中,包括“个案处理摘要”表格和“OLAP立方体”表格。“个案处理摘要”表格体现了观测量的一些基本情况,包括总的个数、有效值个数和缺失值个数。而“OLAP立方体”表格是分层报告,输出了总和和平均值,这个表格中输出的是用户所选择的所有要分析的统计量。
图3-3 OLAP分析结果输出窗口
个案摘要报告,也称观测量摘要报告,主要用于按指定分组统计量不同水平的交叉汇编(类内各子类的统计量),对变量进行记录,并计算相应的统计量。它主要为定量数据提供描述服务,是一个比较常用的过程,可以利用“个案摘要”来预览及打印数据。所以,对已知数据进行统计分析时,先对数据的实际统计量以交叉列表的形式显示,有利于用户比较直观地掌握数据的基本特征,可以提高统计分析的效能。
分组变量可以是一个,也可以是多个,如果是多个的话,将在所有水平进行交叉组合。每个组中,变量值可以显示出来,也可以不显示。对于大数据集,可以仅列出前面的观察值。
在建立或打开一个数据文件后,就可进行个案摘要分析了。同样,在主菜单栏中单击“分析”按钮,然后单击“报告”按钮,选择“个案摘要”选项,打开“摘要个案”对话框,如图3-4所示。
图3-4“摘要个案”对话框
在“摘要个案”对话框中,左边是所有变量的变量列表,右边的“变量”文本框用于选择需要进行记录汇总分析的变量,如果选择多个变量,则系统会在同一张表格内依次对它们进行分析。
下面以“Employee data.sav”为例讲解个案摘要报告的用法,要求为该数据文件中的前12个观测量值制作一个“员工信息概述表”,按照变量gender对数据进行分组,计算每组及所有的变量“salary”“prevexp”和“jobcat”的观测量数目、平均值和极值,并且不排除缺失值。具体操作如下。
(1)打开“Employee data”数据文件后,选择主菜单栏中的“报告”菜单,然后选择“个案摘要”命令,进入如图3-4所示的“摘要个案”对话框。
(2)在如图3-4所示的对话框中选择概述变量“jobcat”“prevexp”和“salary”到“变量”文本框,选择“gender”作为分组变量进入“分组变量”文本框。由于要求输出数据文件中前12个观测量值,所以在“将个案限制到前”文本框中输入“12”以限制观测量数目。由于要在报表中显示缺失值,所有取消选中“仅显示有效个案”复选框,同时取消选中“显示个案号”复选框,不显示观测量在数据文件中的序号。
(3)单击“统计量”按钮进入如图3-5所示的“摘要报告:统计”子对话框,选择“个案数”“平均值”和“范围”作为将要计算的统计量。
图3-5“摘要报告:统计”对话框
(4)单击“继续”按钮回到“摘要个案”对话框。单击“选项”按钮进入“选项”子对话框,设置“标题”为“员工信息概述表”,并且选中“总计副标题”复选框,在表中的分组内显示“总计”。
(5)单击“继续”按钮回到“摘要个案”对话框,设置完毕,单击“确定”按钮进行分析,报表出现在浏览窗口,见表3-1。
表3-1 员工信息概述表
续表
(6)在这个报表前面还有一个观测量的概述表,其中列出了参与概述分析的所有有效观测量数、被排除的观测量数及全部观测量数和它们所占的百分比,见表3-2。
表3-2 Case Processing摘要
行形式摘要报表和列形式摘要报表是专门用于生成复杂报表的,它们均可以对输出表格进行精密定义,以满足用户的各种严格要求。不仅如此,为了方便用户使用,它们输出的结果均为纯文本格式,如果用户感到不满意,可以根据自己的需要将它们导入任何文字处理软件进行编辑,这是它们的一个显著特点,也是SPSS设计人性化、个性化的表现。
在建立或打开一个数据文件后,就可进行形式摘要分析了。在主菜单栏中选择“分析”菜单,单击“报告”子菜单,然后选择“按行汇总的报告摘要”命令,打开“报告:行摘要”对话框,如图3-6所示。
图3-6“报告:行摘要”对话框
列形式摘要报告与行形式摘要报告不同的地方在于,行变量为分组变量值,列变量为进行分析的变量,并且每个摘要变量只有一个统计量输出。但是与“报告按行汇总”相比,“报告按列汇总”更加容易定义,这也使它比较简单,更方便操作。
同样,在“分析”菜单中选择“报告”子菜单,然后选择“按列汇总的报告摘要”命令,就打开了“报告:列摘要”对话框,如图3-7所示。
图3-7“报告:列摘要”对话框