非参数假设检验的特点:
①资料的总体分布类型未知。
②资料的总体分布类型已知,但不符合正态分布。
③某些变量可能无法精确测量。
④方差不齐。
此小节仅介绍非参数假设检验中的秩和检验。
秩和检验主要用于检验两个总体分布是否相同,或者对同一总体的两组测量值,有无系统误差的影响。秩和检验法不要求提供成对的两组数据。
设对同一物理量进行两组测量结果为:
和
y
1
,
y
2
,…,
y
n2
,将测量值混合并按由小到大的次序重新排列,以两组中个数较少的一组为准,将其重新排列的名次(秩)相加,即为秩和,记作
T
。以样本含量较小组的个体数
n
1
、两组样本含量之差
n
2
-
n
1
及
T
值,按给定置信度
α
,查检验界值表,查得
T
1
和
T
2
,若有:
则两组测量值无系统误差,或总体分布相同。
【例2.2】 测试同一物理量,两组数据为:
A: 14.7,14.8,15.2,15.6,15.4
B:14.6,15.0,15.2,15.3
判断两组数据有无系统误差。
解 :将两组数据从小到大混合排列,见表 2.1。
表2.1 从小到大混合排列两数据
两组数据相比,B组仅有 4 个数据,比A组少,故计算B组得秩和
根据 n 1 = 4, n 2 = 5,按给定置信度 α = 0.05,查得 T 1 = 13, T 2 = 27。
显然
两组数据无系统误差影响。
随机实验的结果很多可以用数来表示,另外有一些实验结果虽然是定性的,但也可以量化。
从总体中抽取一个个体,就是对总体 X 进行一次观察并记录其结果。在相同条件下对总体 X 1 , X 2 ,…, X n 是对随机变量 X 观察的结果,且各次观察是在相同条件下独立进行的,所以有理由认为 X 1 , X 2 ,…, X n 是相互独立的,并且是与 X 具有相关分布的随机变量。 X 1 , X 2 ,…, X n 称为总体 X 的一个简单随机样本。
当 n 次观察一经完成,就得到一组实数 x 1 , x 2 ,…, x n ,它们依次是随机变量 X 1 , X 2 ,…, X n 的观察值,称为样本值。
将样本看作随机向量,写成( X 1 , X 2 ,…, X n ),相应地样本值写成( x 1 , x 2 ,…, x n )。如果( x 1 , x 2 ,…, x n )都是相应于样本( X 1 , X 2 ,…, X n )的样本值,一般来说它们是不同的。
若总体 X 的分布函数为 F ( X ),则样本( X 1 , X 2 ,…, X n )的分布函数为:
若总体 X 的概率密度为 f ( x ),则样本( X 1 , X 2 ,…, X n )的概率密度为:
若总体 X 的分布率为 P ( x ),则样本( X 1 , X 2 ,…, X n )的联合分布率为:
一般来说,对于有限总体,采用放回抽样就能得到简单随机样本,但放回抽样使用起来不方便,常用不放回抽样代替,而代替的条件是“总体中个体总数/样本容量”不小于 10%。
设 X 1 , X 2 ,…, X n 是来自总体 X 的样本,常用统计量如下:
(1)样本均值
样本均值反映了总体 X 的期望信息。
(2)样本方差
样本方差
S
2
或记为
。为了消除样本方差与总体量纲的差别,通常取
,称
S
为样本标准差。样本标准差与总体量纲一致,样本方差描述了样本的离散程度,反映了总体
X
的方差信息。
在上述定义中,
为偏差平方和,
n
-1 称为偏差平方和的自由度,其含义是在
X
确定后,
n
个偏差
中,只有
n
-1 个可以自由变动,
n
个数之间有一个约束条件
=0。