集中趋势和离中趋势是数据分布的两大重要特征,但要想全面了解数据分布的特点,还需要知道数据分布的形状对称、偏斜的程度,以及分布的扁平程度等。对数据分布形状的测度主要有偏度和峰度两个统计指标。
偏态是对数据分布对称性的测度,测度偏态的统计量是偏度。如果一组数据的分布是对称的,则偏度等于0;如果偏度明显不等于0,表明分布是非对称的。如果偏度大于1或小于-1,则分布为高度偏态分布;若偏度在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏度越接近于0,说明分布的偏斜程度越低。
一般用SK来表示偏度,它的计算公式如下:
若SK为正值时,可以判断分布为右偏分布;反之,当SK为负值时,可以判断分布为左偏分布。SK的数值越大,表示偏斜的程度越大。
在Excel 2013中,可以用SKEW函数来计算数据的偏度。
表达形式:= SKEW (number1,number2,…)
其中 number1,number2,…是多达30个要求其中位数的参数,也可使用单个数组或区域等。
下面我们通过实验3-11介绍根据数据来计算偏度的相关操作。
实验3-11:以实验3-7使用的数据为例,以该数据为基础计算出产品零售价分布的偏度。根据数据来计算偏度的操作如下:
单击单元格B2,输入公式“=SKEW(A2:A21)”,按Enter键即可计算出该产品零售价分布的偏度,计算结果如图3-20所示,该产品零售价分布的偏度为0.1,说明这组数据的偏斜程度比较低,总体上符合对称分布。
图3-20 实验
峰态是对数据分布平峰或尖峰程度的测度。测度峰态的统计量是峰度。峰态通常是与标准正态分布相比而言的。若一组数据服从标准正态分布,则峰度的值等于0;若峰度的值明显不等于0,则表明分布比正态分布更平或更尖。
一般用K来表示峰度,它的计算公式如下:
用峰度说明分布的扁平或尖峰程度,是通过与标准正态分布的峰度进行比较而言的。正态分布的峰度为0,当K>0时分布为尖峰分布,说明数据的分布更集中;当K<0时分布为扁平分布,说明数据的分布更分散。
在Excel 2013中,可以用KURT函数来计算数据的峰度。
表达形式:= KURT (number1,number2,…)
其中 number1,number2,…是多达30个要求其中位数的参数,也可使用单个数组或区域等。
下面我们通过实验3-12介绍根据数据来计算峰度的相关操作。
实验3-12:仍以实验3-7使用的数据为例,以该数据为基础计算出产品零售价分布的峰度。根据数据来计算峰度的操作如下:
单击单元格B2,输入公式“= KURT (A2:A21)”,按Enter键即可计算出该产品零售价分布的峰度,计算结果如图3-21所示,该产品零售价分布的峰度为-1.122199,说明这组数据为扁平分布,数据的分布比较分散。
图3-21 实验3-12计算结果