购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.3 频数分析

频率分布表是描述性统计中最常用的表格之一,SPSS中的“频率”功能就是专门为产生频数分布表而设计的。SPSS的频数分析可以对单变量的多数类型的数据进行分析,可以产生多个统计量和统计图形。下面主要介绍其功能及相关操作。

3.3.1 主要功能

频率,也是频数,就是一个变量在各个变量值上取值的个案数。如果要了解学生某次考试的成绩,需要计算学生所有分数取值,以及每个分数取值有多少人,则需要用到频数分析,可了解变量取值的分布情况。

SPSS中的频数分析过程可以方便地产生详细的频数分布表,即对数据按组进行归类整理,形成各变量的不同水平的频数分布表和常用的图形,以便对各变量的数据特征和观测量分布状况有一个概括的认识。此外,频数分析还可以按要求给出某个百分点的数值,而且它更适用于对分类变量及不服从正态分布的连续性变量进行描述。

频数分析是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析,以便于掌握数据分布的基本情况,进一步进行数据分析。

3.3.2 频数分析操作步骤

建立或打开数据文件后,即可进行频数分析。在数据编辑窗口中,单击主菜单栏的“分析”菜单,选择“描述统计”子菜单,然后选择“频率”命令,打开如图3-8所示的“频率”对话框。

图3-8“频率”对话框

在“频率”对话框左侧的源变量框中选择一个或多个变量,单击 按钮使其进入右侧的“变量”框中作为频数分析的变量。在频数分析对话框的下方有一个“显示频率表”复选框,选中该框将显示频数分布表,系统默认选中此项。

I 统计选项

单击“统计”按钮,打开如图3-9所示的“频率:统计”对话框。

图3-9 频数分析中的“频率:统计”对话框

该对话框主要用于确定将要在输出结果中出现的统计量,具体的选项及其功能如下。

(1)“百分位值”栏。选中该栏中的复选框,表示输出百分位数:“四分位数”复选框表示输出四分位数,即显示25%、50%、75%的百分位数;“分割点”复选框表示将数据平均分为设定的相等等份,在参数框设置的数值范围必须是2~100的整数;“百分位数”复选框用于显示由用户自定义的百分位数,在参数框中输入数值的范围为0~100。输入数值后单击“添加”按钮。也可以重复此操作过程,键入多个百分位数。如果要删除已键入的百分位数,则选中要删除的数,单击“除去”按钮。如果要修改已键入的百分位数,则选中该数,在参数框中输入新数,单击“更改”按钮即可。

(2)“离散”栏。选中此栏中的复选框,表示选中所需计算的统计量,包括标准差、最小值、方差、最大值、范围(最大值与最小值之差)、标准误差平均值。

(3)“集中趋势”栏。此栏中包括平均值、中位数、众数、总和。

(4)“分布”栏。此选项组给出了计算描述分布的统计量。

偏度:显示偏度和偏度的标准误差。如果样本符合正态分布,那么此值为0。左偏时为正数,样本的分布具有一个较长的右尾;右偏时为负数,样本的分布具有一个较长的左尾。如果此值大于1,那么样本肯定不符合正态分布。

峰度:显示峰度和峰度的标准误差。标准正态分布的峰度值为0,如果峰度大于0,变量值分布要比标准正态峰高;如果峰度小于0,变量值分布要比标准正态峰低。

(5)“值为组的中点”复选框。选中该框,在计算百分位数值和中位数时,如果数据已经分组,就用已经分组的数据计算中位数和百分位数。

设置完“统计”后,单击“继续”按钮,确认操作并返回到“频率”对话框。

II 图表选项

单击“图表”按钮,打开如图3-10所示的“频率:图表”对话框。在该对话框中可以设置图形的类型及坐标轴等。

图3-10 “频率:图表”对话框

“频率:图表”对话框中显示两个选项组,分别是图表类型和图表值。

(1)“图表类型”栏。该选项组给出了图表输出的方式,包括“无”是系统默认状态,表示不输出任何图形;“条形图”表示输出条形图,各条形的高度代表变量各分类的频数;“饼图”表示输出饼图,图中各块代表变量各分类的频数;“直方图”表示输出直方图,此图仅适用于区间型数值变量。选择了“直方图”选项后,下方的“在直方图中显示正态曲线”复选框被激活,选择该项表示在显示的直方图中添加正态曲线图,用于推断数据是否近似服从正态分布。

(2)“图表值”栏。该选项组只有选择了条形图或饼图才有效,可以选择SPSS图形取值的计算方式,有两个单选项,分别为“频率”,系统默认选中该项,表示图形中的度量用相应变量的个案频数表示,即纵轴表示频数;“百分比”,表示图形中的度量用相应变量的个案数占个案总数的百分比表示,即纵轴表示百分比。

设置完毕后,单击“继续”按钮确认选择并返回到“频率”对话框。

III 格式选项

单击“格式”按钮,打开如图3-11所示的“频率:格式”对话框。

图3-11 “频率:格式”对话框

在该对话框中可以设置输出的频数分析表的格式。对话框中的各项含义如下。

(1)“排序方式”选项组中的选项用于设置频数分析表中数据的排列顺序,包括4个单选项:“按值的升序排序”选项是系统默认项,表示按变量值升序排列;“按值的降序排序”选项,表示按变量值降序排列;“按计数的升序排序”选项,表示按变量各种取值出现的频数的升序排列;“按计数的降序排序”选项,表示按变量各种取值出现的频数的降序排列。

但是,如果设置了直方图或百分位数输出,那么不管用户如何设置,频数表都将按变量值升序排列。

(2)“多个变量”选项组用于进行多变量频数分析时设置表格的显示方式,包括两个单选项:“比较变量”是系统默认选项,表示不同变量的统计量显示在同一张列表中;“按变量组织输出”表示不同变量的统计量分别显示在不同的表格中。

(3)“禁止显示具有多个类别的表”复选框表示输出的分类数量。选择该项时下面的“最大类别数”文本框被激活,输入最大的显示分类变量,即输出的组数不能大于窗口中输入的数值,系统默认值为10。例如,如果样本中体重设定的分组值为11,在该复选框中输入10,就不会输出频数分布表。

设置完成后,单击“继续”按钮确认选择并返回到“频率”对话框。

完成所有选择后,单击“确定”按钮即可进行频数分析。“重置”按钮用于重新设置选择项,“取消”按钮用于取消所设置的选项并关闭对话框,单击“帮助”按钮可打开相关的帮助文档,“粘贴”按钮用于将设定的统计过程及选择项对应的程序粘贴到“语法”程序窗口中。

3.3.3 实例分析

下面利用一个实例来介绍通过“频率”进行频数分析及编制频数分析表的操作步骤及方法,以便读者更直接地掌握“频率”的用法。

以数据文件“住房状况调查.sav”为例,对变量“分组后的人均面积”进行简单的频数分析。由于该变量是分组变量,所以不计算相关的最小值、最大值、平均值等统计量,要求输出带正态分布曲线的直方图。具体操作步骤如下。

首先,在菜单栏中单击“分析”按钮,选择“描述统计”子菜单,然后选择“频率”命令,打开“频数分析”对话框。

在“频数分析”对话框中,选择“分组后的人均面积”作为需要分析的变量,单击 按钮进入“变量”文本框。

由于本案例中不要求计算其他统计量,所以不用在“频率:统计”中进行相关设置,只需在“频率:图表”中选择图表类型即可,选择“直方图”,并激活“在直方图中显示正态曲线”复选框。

设置完毕后,单击“粘贴”按钮可以将所设定的统计过程及选择项对应的程序粘贴到“语法”窗口中。单击“确定”按钮,系统开始分析,得到如下结果。

该操作过程的语法程序语句如下。

表3-3是频数分析表,包括以下几部分:各变量值的频数、各变量值所占的百分比、有效值所占的百分比、累积百分比、合计。

表3-3 分组后的人均面积频数分析表

从表3-3可以看出,占百分比最多的是“10~20平方米”的变量,占总变量数的44.8%,说明在所收集到的所有数据中,人均居住面积在10~20平方米的人最多。

图3-12是带正态曲线的直方图,从图中可以看到数据的分布与标准正态分布基本一致。

图3-12 频数分析的直方图 Ot5vvUxM/FpaqKcR0yRt8HMtNFknq7xp+CrJq86xohdhCZT90FuHDjNzzNtU/BKm

点击中间区域
呼出菜单
上一章
目录
下一章
×