非参数假设检验的特点:
①资料的总体分布类型未知。
②资料的总体分布类型已知,但不符合正态分布。
③某些变量可能无法精确测量。
④方差不齐。
此小节仅介绍非参数假设检验中的秩和检验。
秩和检验主要用于检验两个总体分布是否相同,或者对同一总体的两组测量值,有无系统误差的影响。秩和检验法不要求提供成对的两组数据。
设对同一物理量进行两组测量结果为: 和 y 1 , y 2 ,…, y n2 ,将测量值混合并按由小到大的次序重新排列,以两组中个数较少的一组为准,将其重新排列的名次(秩)相加,即为秩和,记作 T 。以样本含量较小组的个体数 n 1 、两组样本含量之差 n 2 - n 1 及 T 值,按给定置信度 α ,查检验界值表,查得 T 1 和 T 2 ,若有:
则两组测量值无系统误差,或总体分布相同。
【例2.2】 测试同一物理量,两组数据为:
A: 14.7,14.8,15.2,15.6,15.4
B:14.6,15.0,15.2,15.3
判断两组数据有无系统误差。
解 :将两组数据从小到大混合排列,见表 2.1。
表2.1 从小到大混合排列两数据
两组数据相比,B组仅有 4 个数据,比A组少,故计算B组得秩和
根据 n 1 = 4, n 2 = 5,按给定置信度 α = 0.05,查得 T 1 = 13, T 2 = 27。
显然
两组数据无系统误差影响。
随机实验的结果很多可以用数来表示,另外有一些实验结果虽然是定性的,但也可以量化。
从总体中抽取一个个体,就是对总体 X 进行一次观察并记录其结果。在相同条件下对总体 X 1 , X 2 ,…, X n 是对随机变量 X 观察的结果,且各次观察是在相同条件下独立进行的,所以有理由认为 X 1 , X 2 ,…, X n 是相互独立的,并且是与 X 具有相关分布的随机变量。 X 1 , X 2 ,…, X n 称为总体 X 的一个简单随机样本。
当 n 次观察一经完成,就得到一组实数 x 1 , x 2 ,…, x n ,它们依次是随机变量 X 1 , X 2 ,…, X n 的观察值,称为样本值。
将样本看作随机向量,写成( X 1 , X 2 ,…, X n ),相应地样本值写成( x 1 , x 2 ,…, x n )。如果( x 1 , x 2 ,…, x n )都是相应于样本( X 1 , X 2 ,…, X n )的样本值,一般来说它们是不同的。
若总体 X 的分布函数为 F ( X ),则样本( X 1 , X 2 ,…, X n )的分布函数为:
若总体 X 的概率密度为 f ( x ),则样本( X 1 , X 2 ,…, X n )的概率密度为:
若总体 X 的分布率为 P ( x ),则样本( X 1 , X 2 ,…, X n )的联合分布率为:
一般来说,对于有限总体,采用放回抽样就能得到简单随机样本,但放回抽样使用起来不方便,常用不放回抽样代替,而代替的条件是“总体中个体总数/样本容量”不小于 10%。
设 X 1 , X 2 ,…, X n 是来自总体 X 的样本,常用统计量如下:
(1)样本均值
样本均值反映了总体 X 的期望信息。
(2)样本方差
样本方差 S 2 或记为 。为了消除样本方差与总体量纲的差别,通常取 ,称 S 为样本标准差。样本标准差与总体量纲一致,样本方差描述了样本的离散程度,反映了总体 X 的方差信息。
在上述定义中, 为偏差平方和, n -1 称为偏差平方和的自由度,其含义是在 X 确定后, n 个偏差 中,只有 n -1 个可以自由变动, n 个数之间有一个约束条件 =0。