购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

4.2 频数统计

在统计分组中,落在不同小组中的数据个数为该组的频数,各组的频数之和等于这组数据的总数,通过对每组频数的统计,可以看出数据的大体分布情况,根据分组标志的特点,还可以通过频数统计进行比较分析等方式认识数据。

4.2.1 单项式分组的频数统计

在Excel 2013中,单项式分组的频数统计是借助函数COUNTIF来实现的,其格式公式为

COUNTIF(range,criteria)

其中,“range”指目标区域,是一个或多个要计数的单元格,其中包括数字或名称、数组或包含数字的引用,空值和文本值将被忽略;“criteria”为一条件值,即确定哪些单元格将被计算在内的条件,其形式可以为数字、表达式、单元格引用或文本。例如,条件可以表示为“32”、“>32”、“pples”。

下面通过实验来介绍Excel 2013运用单项式分组的方法进行频数统计的操作步骤。

实验4-3:根据某高校某专业90名本科毕业生的年龄数据,计算其频数,图4-5是原始数据。

图4-5 实验4-3的原始数据

详细思考和操作过程如下:

(1)考虑到此例中的年龄数据是离散型的,而且变化幅度不大,所以应当采用单项式分组法分组和计算其频数。也就是说分五组,分别为“20岁”、“21岁”、“22岁”、“23岁”、“24岁”。

(2)在工作簿Sheet2中的单元格A2、A3、A4、A5、A6中依次输入“20”、“21”、“22”、“23”、“24”,在单元格B2中输入“=COUNTIF(Sheet1!A1:F15,Sheet1!A2)”,其中,“range”为目标区域,指数据来源,即工作簿Sheet1里的A1:F15区域,因此公式第一项参数填写“Sheet1!A1:F15”,“criteria”为计数条件,即分组标志值,因此公式第二项参数填写“Sheet1!A2”或者“20”,按下Enter键。

(3)相类似地,在单元格B3、B4、B5、B6中依次输入“=COUNTIF (Sheet1!A1:F15,Sheet1!A3)”、“=COUNTIF(Sheet1!A1:F15,Sheet1!A4)”、“=COUNTIF (Sheet1!A1:F15,Sheet1!A5)”、“=COUNTIF(Sheet1!A1:F15,Sheet1!A6)”,按下Enter键。

(4)频率等于频数/总数,所以在单元格C2、C3、C4、C5、C6中依次输入“=B2/90”、“=B3/90”、“=B4/90”、“=B5/90”、“=B6/90”,按下Enter键,得到如图4-6所示的结果。

图4-6 实验4-3的结果数据

图4-6中,A列为数据分组情况,B列为各组频数统计,C列为各组频率计算。

4.2.2 组距式分组的频数统计

单项式变量分组的频数统计比较明确、容易,但是做连续变量分组的频数统计时,单项数列不能适用,所以应当考虑采用组距分组法来进行频数统计。

在Excel 2013中,组距式分组的频数统计也是借助函数FREQUENCY来实现的,步骤更加复杂一些,其格式公式为

FREQUENCY(data_array,bins_array)

其中,“data_array”是一个数组或对一组数值的引用,你要为它计算频率,如果“data_array”中不包含任何数值,函数FREQUENCY将返回一个零数组;“bins_array”是一个区间数组或对区间的引用,该区间用于对“data_array”中的数值进行分组。如果“bins_array”中不包含任何数值,函数FREQUENCY返回的值与“data_array”中的元素个数相等。

下面通过实验4-4来介绍Excel 2013运用组距式分组的方法进行频数统计的操作步骤。

实验4-4:根据某公司员工实际完成任务的比例数据(单位是%),计算其频数,图4-7是原始数据。

图4-7 实验4-4的原始数据

详细思考和操作步骤如下:

(1)计算全距。将各变量值由小到大排序,确定其最大值,最小值,并计算全距。变量的最大值是129%,最小值是81%,全距=最大值-最小值=129%-81%=48%。

(2)确定组数和组距。在等距分组时,组距与组数的关系是组距=全距/组数。本例中根据一般将成绩分成优、良、中、及格和不及格五档评分的习惯,可以先确定组数为5。在等距分组时,计算组距,组距=48%/5=9.6%,为了符合习惯和计算方便,组距近似地取10%。

(3)确定组限。关于组限的确定,应注意如下几点:①最小组的下限(起点值)应低于最小变量值,例如可选80,最大组的上限(终点值)应高于最大变量值,例如可选130;②组限的确定应有利于表现出总体分布的特点,应反映出事物质的变化;③为了方便计算组限应尽可能取整数,最好是5或10的整倍数。在工作簿Sheet2中的单元格A2、A3、A4、A5、A6、A7内依次输入“80”、“90”、“100”、“110”、“120”、“130”,为分组界限,分别代表“<=80”、“80-90”、“90-100”、“100-110”、“110-120”、“120-130”、“>=130”的区间。

(4)在工作簿Sheet2中选中单元格C2:C8,并在编辑栏中输入“=FREQUENCY (Sheet1!A1:E6,Sheet2!A2:A7)”,其中,“data_array”是数据源,所以输入“Sheet1!A1:E6”,“bins_array”是分组数据,所以输入“Sheet2!A2:A7”,按下Enter键。

(5)频率等于频数/总数,所以在单元格D2、D3、D4、D5、D6中依次输入“=C2/30”、“=C3/30”、“=C4/30”、“=C5/30”、“=C6/30”,按下Enter键,得到如图4-8所示的结果。

图4-8 实验4-4的结果数据

图4-8中,A列为数据分组界限,B列为数据分组情况,C列为各组频数统计,D列为各组频率计算值。

4.2.3 频数统计直方图

以分组标志为横轴,以频数为纵轴的柱形图就是频数统计直方图。直方图又称质量分布图,是一种几何形图表,它是根据从生产过程中收集来的质量数据分布情况,画成的直方型矩形图。它使得频数统计以更加直观简易的形式表现出来,方便对数据特征的研究和提炼。

例如,若以实验4-3的结果数据中的分组标志“毕业生年龄”为横轴,以“频数”为纵轴,可以得到柱形图,如图4-9所示,该图即为实验4-3的频数统计直方图。

图4-9 实验4-3的频数统计直方图

从图中可以观察到,年龄为20岁和21岁的毕业生是最多的,而且是同样多的,22岁、23岁、24岁的毕业生数量相对少一些,但它们之间差异不大。

再如,若以实验4-4的结果数据中的分组标志“分区区间”为横轴,以“频数”为纵轴,可以得到柱形图,如图4-10所示,该图即为实验4-4的频数统计直方图。

图4-10 实验4-4的频数统计直方图

从图中可以观察到,工作完成100%~110%的员工数量最多,稍逊一些的是工作完成110%~120%的员工,工作完成120%~130%的员工最少。 QKa+6Wju/FD9iAaTAon8DNBBXi1uJbtjenH8lI/Agjnt/QCGY4kxOrSc6dZZ8QMN

点击中间区域
呼出菜单
上一章
目录
下一章
×