用子样观测值推断总体的参数特征属于统计推断的范畴,包括两方面的内容:参数估计和统计检验。
由于实验研究工作的需要,往往先要对总体的某一统计特征进行假定,之后利用反复观测的子样数据,根据概率统计进行计算,以判断假设是否成立,这就是统计检验或假设检验。
u 检验是一般用于大样本(即样本容量大于 30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
当已知标准差时,验证一组数的均值是否与某一期望值相等时,用 u 检验。另外,对于 u 检验国外的统计学教材大多采用 Z 检验的说法。而国内统计学书籍,大多采用 u 检验。
1)总体均值的一致性检验
(1)双边检验
设总体 ,子样观测值 x 1 , x 2 ,…, x n ,检验假设 H 0 : μ = μ 0 ( μ 0 为已知常数),子样均值服从正态分布 标准化可以得到统计量
对于给定的信度 α ,可根据正态分布密度函数,查到 ,使:
子样观测值计算 u 0 ,如有 ,则接受原假设检验,否则拒绝。
在实际检验中,人们往往感兴趣的是在采用新工艺或新参数配比后,总体的均值有显著增大,例如相变材料的强度、产品的使用寿命、空调设备的效率等指标无疑是越高越好的,而成本、原料消耗等指标应尽可能地小一些,这一类问题的处理涉及单边检验。
(2)右边检验
在这种情况下,将检验新的总体均值 μ 是否比原总体均值 μ 0 大,即在显著水平 α 下,检验假设 H : μ ≥ μ 0 ,当 时接受假设,反之否定原假设,此时认为总体均值 μ 比原均值 μ 0 显著地增大了。
(3)左边检验
同样,在显著水平 α 下,将检验新的总体均值 μ 是否比原总体均值 μ 0 小,即在显著水平 α 下,检验假设 H : μ ≤ μ 0 ,当 时接受假设,反之否定原假设,此时认为总体均值 μ 比原均值 μ 0 显著地减小了。
2)两个总体均值的一致性检验
u 检验可以来检验两个遵守正态分布,标准偏差不相等的总体均值是否有显著性差异,即检验假设 H : μ 1 = μ 2 。
设两总体为 和 ,已知 ,检验假设 H 0 : μ 1 = μ 2 。
分别取来自两个总体的容量为 n 1 和 n 2 的子样,子样平均值 ,其 u 值计算公式为:
在显著水平 α 下,检验 时,否定假设 H : μ 1 = μ 2 ,即认为两总体均值存在显著性差异。同样也可以对 μ 1 和 μ 2 进行单侧检验。
右边 u 检验:原假设 μ 1 ≤ μ 2 ,当 u > u α 时否定原假设。
左边 u 检验:原假设 μ 1 ≥ μ 2 ,当 u <- u α 时否定原假设。
t 检验也称Student t 检验(Student’s t test),主要用于样本含量较小(如 n <30),总体标准差 σ 未知的正态分布检验。
设总体 X ~ N ( μ , σ 2 ), σ 未知,子样观测值 x 1 , x 2 ,…, x n ,检验假设 H 0 : μ = μ 0 ( μ 0 为已知常数)。
总体标准差未知,只能用子样标准差取代,将统计量定义为:
若 H 0 成立,则 t 分布服从自由度为 n -1 的 t 分布,按给定的置信度 α ,可以查出 ,使
由子样计算得到的统计量 t > t α/2 时,否定原假设,否则接收。同样可以用 t 检验来判断两个正态总体的均值的差。
设两总体为 和 ,已知 ,但数值未知,需要检验假设 H 0 : μ 1 = μ 2 。
因总体方差未知,故用子样方差的加权平均值取代:
作统计量
若原假设 H 0 成立,可以证明,统计量 t 服从自由度为 n 1 + n 2 -2 的 t 分布,因此给定置性度 α 下进行 t 检验。
在显著水平下,按照总自由度 f = n 1 + n 2 -2 及 α 查 t 分布表(附录 4),确定拒绝域临界点 ,当 时,否定假设 H 0 : μ 1 = μ 2 ,进行单边检验的方法和步骤同 u 检验法。
如果 n 1 和 n 2 都比较大,则可以用下式近似计算统计量 t :
这里的 n 1 和 n 2 不一定相等,但最好不要相差太大,在显著性水平 α 下,当 时,否定假设。
当需要检验总体方差时,则应利用 χ 2 分布的统计量。
设总体 均未知,子样观测值 x 1 , x 2 ,…, x n ,检验假设 H 0 : σ = σ 0 ( σ 0 为已知常数)。
总体标准差 σ 未知,只能用子样标准差 S 取代,被检验假设 H 0 : σ = σ 0 也可以写作 = 1,这样被检验假设可化为检验 是否接近 1 的问题,于是统计量定义为:
公式的比值具有上限和下限,查表时应注意使 χ 2 满足:
这是因为若假设 H 0 成立,值必定在上限和下限值之间,否则即舍弃原假设 H 0 。
F 检验用于检验二项正态总体方差的齐性。
设二项正态总体 和 ,其中 μ 1 , μ 1 , σ 1 , σ 2 均未知。若已知两个总体的子样分别为 和 ,要求检验假设 H 0 : σ 1 = σ 2 。
由于 σ 1 , σ 2 均未知,若判断 σ 1 = σ 2 ,只能用二子样方差取代,问题归结为比较 的问题,所以应从 出发就构造统计量:
F 服从第一自由度为 n -1,第二自由度为 m -1 的 F 分布,记作 F ~ F ( n -1, m -1)。
按照给定的置信度 α ,根据自由度( n -1, m -1),可以通过查表查出上限值,使
查下限时,
不能直接提供,需做变换,使
~ F ( m -1, n -1),查表得到 ,即可得出 值。