购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.2 频数分析

3.2.1 频数分析简介

频数也称频率,表示一个变量在不同取值下的个案数。频数分析可以对数据的分布趋势进行初步分析,为深入分析打下基础。SPSS中的频数分析过程可以方便地产生详细的频数分布表,使数据分析者可以对数据特征与数据的分布有一个直观地认识。此外,SPSS的频数分析过程还可以给出相应百分点的数值,因而其在分类变量和不服从正态分布变量的描述中具有广泛的应用。

3.2.2 频数分析的SPSS操作

在菜单栏中选择“分析”|“描述统计”|“频率”命令,打开如图3-9所示的“频率”对话框。在源变量列表框中选择一个或多个变量,单击 按钮使其选入“变量”列表框中作为频数分析的变量,分别进行相应的设置。

1.“统计”设置

单击“统计”按钮,打开如图3-10所示的“频率:统计”对话框。该对话框用于设置需要在输出结果中出现的统计量,主要包括4个选项组。

(1)“百分位值”选项组:该选项组主要用于设置输出的百分位数,包括以下3个复选框:

“四分位数”复选框:用于输出四分位数。

“分割点”复选框:用于输出等间隔的百分位数,在其后的文本框中可以输入介于2~100的整数。

“百分位数”复选框:用于输出用户自定义的百分位数。在其后的文本框中输入自定义的百分位数,然后单击“添加”按钮加入相应列表框即可在结果中输出。对于已经加入列表框的百分位数,用户还可以通过“更改”和“除去”按钮进行修改和删除操作。

图3-9 “频率”对话框

图3-10 “频率:统计”对话框

(2)“集中趋势”选项组:该选项组用于设置输出表示数据集中趋势的统计量,包括“平均值”“中位数”“众数”和”总和”4个复选框,分别用于输出的均值、中位数、众数和样本数。

(3)“离散”选项组:该选项组用于设置输出表示数据离中趋势的统计量,包括“标准差”“方差”“最小值”“最大值”“范围”和“标准误差平均值”6个复选框,用于输出的标准差、方差、最小值、最大值、全距和均值的标准误差。

(4)“分布”选项组:该选项组用于设置输出表示数据分布的统计量,包括“偏度”和“峰度”两个复选框,用于输出样本的偏度和峰度。

(5)“值为组的中点”复选框:表示当原始数据采用的是取组中值的分组数据时(如所有收入在1000~2000元的收入都记录为1500元),则选中该复选框。

2.“图表”设置

单击“图表”按钮,打开如图3-11所示的“频率:图表”对话框。该对话框用于设置输出的图表,主要包括两个选项组。

(1)“图表类型”选项组:该选项组用于设置输出的图表类型,有4种选择:“无”表示不输出任何图表;“条形图”表示输出条形图;“饼图”表示输出饼状图;“直方图”表示输出直方图(仅适用于数值型变量),若选中“在直方图上显示正态曲线”复选框,则表示在输出图形中包含正态曲线。

(2)“图表值”选项组:该选项组仅对条形图和饼状图有效,包括频率和百分比两个选项。

3.“格式”设置

单击“格式”按钮,打开“频率:格式”对话框,如图3-12所示。该对话框用于设置输出格式,主要包括两个选项组和一个复选框。

图3-11 “频率:图表”对话框

图3-12 “频率:格式”对话框

(1)“排序方式”选项组:该选项组用于设置输出表格内容的排序方式,包括“按值的升序排序”“按值的降序排序”“按计数的升序排序”和“按计数的降序排序”4个选项,分别表示按变量值和频数的升序或降序排列。

(2)“多个变量”选项组:该选项组用于设置变量的输出方式,包括两个选项:“比较变量”表示将所有变量在一个表格中输出;“按变量组织输出”表示每个变量单独列表输出。

(3)“排除具有多个类别的表”复选框:选中该复选框后,可以在下面的“最大类别数”文本框中输入最大能显示的分组数量,当频数表的分组数量大于此临界值时不做输出。

设置完毕后,单击“继续”按钮,返回到“频率”对话框。单击“确定”按钮,就可以在SPSS Statistics查看器窗口得到所选择的变量频数分析的结果。

3.2.3 实验操作

下面以数据文件“3-2”为例,说明频数分析的具体操作过程。

1.实验数据描述

数据文件“3-2”显示了2008年我国各个地区制造业的就业人数,数据来源于《中国统计年鉴2008》。以该数据文件为例,利用频数分析对不同地区的就业情况进行分析,显示四分位数、均值和标准差,绘制频率分布直方图和正态曲线,并判断分布形态。

本数据文件的原始Excel文件如图3-13所示(单位:万)。

在SPSS的变量视图中,建立变量“地区”和“制造业”,如图3-14所示。

在SPSS活动数据文件中的数据视图中,把相关数据输入到各个变量中,输入后部分数据如图3-15所示。

图3-13 数据文件“3-2”的原始数据

图3-14 数据文件“3-2”的变量视图

图3-15 数据文件“3-2”的数据视图

2.实验操作步骤

具体的操作步骤如下:

打开数据文件“3-2”,进入SPSS Statistics数据编辑器窗口,然后在菜单栏中选择“分析”|“描述统计”|“频率”命令,打开“频率”对话框。

在源变量列表框中选中“制造业”作为频数分析的变量。

单击“统计”按钮,选中“四分位数”“平均值”“标准差”和“偏度”复选框,单击“继续”按钮。

单击“图表”按钮,选中“直方图”单选按钮与“在直方图中显示正态曲线”复选框,单击“继续”按钮。

单击“确定”按钮,执行频数分析。

3.输出结果分析

选定需要进行频数分析的变量和设置所需要得到的统计量后,单击“确定”按钮就可以得到频数分析的结果,输出结果如图3-16所示。

图3-16 频数分析输出结果

统计量表给出了平均工资的均值、标准差、百分位数等信息,从分析结果可以看出,各地区制造业就业的平均人数为110.783,标准差为105.2184,3个百分位数分别为39.334、72.708和143.037。表的右侧为频率分布直方图和正态曲线。偏度系数为1.579,由此可以看出,各地区的平均工资呈比较明显的偏态分布。 S9HIPHJa4K/vD+eT0ZuuJrrgOH6d9hNiLg3zcQr2290QAtZbrnxn5Y+2Q4J6H6wk

点击中间区域
呼出菜单
上一章
目录
下一章
×