统计学中有些随机变量是为了分析需要而构造出来的,它们的构造都由正态随机变量导出,并且它们的概率分布在统计推断中具有独特的地位和作用。
χ 2 分布(chi-square distrbution)是由Abble在1863年首先提出,后由海尔墨特(Helmert)和皮尔逊(Pearson)分别于1875年和1900年付诸实施。 χ 2 分布是一种常用的连续型随机变量的概率分布,用于检验资料的实际频数与理论频数是否相等的问题。如 Z 1 , Z 2 ,…, Z n 为互相独立的标准正态变量,则称它们平方和构成的变量服从自由度(degree of freedom) ν = n 的 χ 2 分布,记为 。
在不同自由度下 χ 2 分布如图4-5所示:
图4-5 具有多个自由度的卡方分布
从图4-5可以看出,随着自由度的增大而逐渐趋于对称,当自由度趋于无穷大时 χ 2 分布逼近正态分布。各种自由度的 χ 2 分布右侧尾部面积为 α 时的临界值记为 ,列在附表7中。附表7列出自由度从1到50的卡方分布累积分布函数值,表的上方列出单尾概率从0.995到0.005,表的左边列出不同自由度,根据单尾概率和自由度可查卡方分布的临界值。
t 分布(t-distribution)是由英国统计学家W.S.Gosset于1908年以“Student”笔名发表论文,又称Student t 分布(Student's t-distribution)。 t 分布是一种常用的连续型的随机变量分布,开创了小样本研究的新纪元。主要用于检验样本均数与总体均数之间的差异、两样本均数之间的差异是否具有显著性意义以及对总体均数进行区间估计等。若 Z ~ N (0,1), 且 Z 、 χ 2 独立,则称变量服从自由度为 n 的 t 分布,记为 t ~ t ( n ) 。
在不同自由度下 t 分布如图4-6所示:
图4-6 t 分布和标准正态分布比较
从图中可看出, t 分布是一种类似标准正态分布的对称分布,通常要比标准正态分布平坦和分散。决定 t 分布形态的参数是自由度,随着自由度的增大, t 分布也逐渐趋于标准正态分布。同样附表5列出了自由度从1到50,另外还给出100和∞的自由度,该表给出了单尾面积(即单尾概率)的范围从0.25到0.00005,双尾面积(即双尾概率)是从0.5到0.0001。本书把与单尾面积相对应的 t 临界值用 t α ( ν )表示,把与双尾面积相对应的 t 临界值用 t α /2( ν ) 表示。
F 分布(F-distribution)是一种连续型的随机变量的概率分布,由著名统计学R.A.Fisher费歇尔于1924年提出,并由斯奈迪格(Snedecor)于1934年完善。主要用于方差的齐性检验和方差分析等。
若 ,且 互相独立,则称它们构成的变量:
服从第1自由度 ν 1 = n 1 、第2自由度 ν 2 = n 2 的 F 分布,记为 。
在不同自由度下 F 分布如图4-7所示。从图中可看出 F 分布密度曲线偏向左侧,随着 n 1 、 n 2 同时增大,均数趋近于1。同样附表6列出了不同自由度下 F 的单尾面积(即单尾概率)和双尾面积(即双尾概率)0.01和0.05的 F 临界值。 F 分布的单侧界值表示 右边的曲线下面积为 α ,双侧界值表示 右边或 左边的曲线下面积各为 α /2。
图4-7 具有多个自由度的 F 分布