偏度和峰度描述数据分布是否对称和集中趋势高低特征,它们是和正态分布相比较的。在广告研究中,偏度和峰度用来判断数据分布是否符合正态分布,在多数情况下,许多统计方法的运用前提条件就是收集到的广告数据必须符合正态分布。
偏度(Skewness)是描述某变量取值分布对称性的统计量。计算公式:
其中, a 3 表示偏态系数; σ 3 表示标准差的三次方。当分布对称时, X i - = 0, a 3 = 0,即:
a 3 = 0, 分布形态与正态分布偏度相同。
a 3 > 0, 正偏差数值较大,为正偏或右偏。长尾巴拖在右边。
a 3 < 0, 负偏差数值较大,为负偏或左偏。长尾巴拖在左边。
如图 3-7 所示:
图3-7 右偏和左偏
峰度(Kurtosis)是描述某变量所有取值分布形态陡缓程度的统计量。计算公式:
其中, a 4 表示峰度系数; σ 4 表示标准差的四次方。正态分布的峰度系数为 3,当分布与正态分布的峰度系数相同时, a 4 = 0,即:
a 4 = 0,与正态分布的陡缓程度相同。
a 4 > 0,比正态分布的高峰更加陡峭——尖顶峰。
a 4 < 0,比正态分布的高峰来得平缓——平顶峰。
如图 3-8 所示:
图3-8 尖顶峰和平顶峰
1.研究问题
求某品牌汽车发动机启动时间(秒)的偏度和峰度,数据同图 3-1 所示。
2.实现步骤
(1)单击“Analyze”菜单“Descriptive Statistics”项中的“Frequencies”命令,弹出“Frequencies”对话框,单击 按键使“发动机启动时间”变量添加到“Variable-(s)”框中。同图 3-2 所示。
(2)单击下方的“Statistics”按钮,弹出如图 3-9 所示的对话框。选择要统计的项目,在“Distribution”框中选择“Skewness” “ Kurtosis”,选好后单击“Continue”按钮返回“Frequencies”对话框,单击“OK”按钮,SPSS即开始计算。
图3-9 “Frequencies:Statistics”对话框
(3)计算的结果如图 3-10,可以看出该品牌汽车发动机启动时间偏度为0.211,正偏差数值较大,为正偏或右偏。长尾巴拖在右边。峰度为 0.389,比正态分布的高峰更加陡峭,为尖顶峰。
图3-10 计算结果