与前面提到的定距变量不同,分类变量的数值只代表观测值所属的类别,不代表其他任何含义。因此,对分类变量的描述统计方法是观察其不同类别的频数或者百分数。本节将介绍单个分类变量的汇总在实例中的应用。
【例3.3】 某国有银行沈阳分行人力资源部对分行本部在岗职工的结婚情况进行了调查。调查结果分为两类,一类代表结婚,另一类代表未婚或者离异。统计数据如表3.5所示。试对结婚情况这一变量进行单个变量汇总。
表3.5 某银行沈阳分行本部在岗职工的结婚情况
在用Stata进行分析之前,我们要把数据录入Stata中。本例中有两个变量,分别为性别和结婚情况。我们把性别变量设定为gender,把结婚情况变量设定为marry,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作在第1章中已详细讲述过了。录入完成后数据如图3.13所示。
图3.13 案例3.3的数据
先保存数据,然后开始展开分析,步骤如下:
进入Stata 16.0,打开相关数据文件,弹出主界面。
在主界面的Command文本框中输入命令:
tabulate marry
设置完毕后,按回车键,等待输出结果。
在Stata 16.0主界面的结果窗口中可以看到如图3.14所示的分析结果。
图3.14 分析结果图1
从分析结果中可以看出本次调查所获得的信息。可以发现该银行的分行本部共有114人参与了有效调查,其中处于结婚状态的有69位员工,占比60.53%,处于非结婚状态的有45位员工,占比39.47%。此外,结果分析表中Cum.一栏表示的是累计百分比。
以本节所介绍的案例为基础,试对结婚情况这一变量进行单个变量汇总并附有星点图。
操作命令应该为:
tabulate marry,plot
在命令窗口输入命令并按回车键进行确认,结果如图3.15所示。
图3.15 分析结果图2
从分析结果中可以看出对结婚情况这一变量进行单个变量汇总的结果以及星点图情况。