正态分布是一种连续型随机变量的分布,是一种特别重要的分布。实验观测值的偶然误差服从正态分布。基于标准正态分布构造的 3 个著名统计量在实际问题中有着广泛的应用,被称为统计学中的“三大抽样分布”。
正态分布又称高斯分布,其概率密度函数定义为:
有两个参数,数学期望
μ
和方差
σ
2
(
σ
>0)。当随机变量
X
服从数学期望
μ
和方差
σ
2
的正态分布时,常用
X
~
N
(
μ
,
σ
2
)来表示。对于随机变量
X
~
N
(
μ
,
σ
2
)的正态变量
x
作
的变换,就可以得到标准正态分布
μ
~
N
(0,1)。利用数学上已经计算好的标准正态分布数值表,可以得出任意正态分布数值。
正态分布概率密度曲线具有以下几个特征:
①单峰性。
②对称性。
③ X 在± σ 处存在拐点。
④当 X →±∞ , f ( x )→0。当 X ~ N ( μ , σ 2 )时, x 落在[ μ - γσ , μ + γσ ]的概率不同参数值的正态分布概率密度曲线如图 2.3 所示,可以利用公式及正态分布表得到。
图 2.3 不同参数值的正态分布概率密度曲线
χ 2 分布是由海尔墨特(Hermert)和卡尔·皮尔逊(Karl Pearson)分别于 1875 年和 1900 年推导出来的。
设随机变量 X 1 , X 2 ,…, X n 相互独立,且都服从标准正态分布 N (0,1),则称随机变量
服从自由度为 n 的 χ 2 分布,记为 χ 2 ~ χ 2 ( n )。这里自由度 n 可以理解为式(2.16)中相互独立的标准正态分布的个数。
用概率论知识,可以求出 χ 2 的密度函数为:
式中,
是伽马函数Γ(
x
)=
在
x
=
处的值,密度曲线如图2.4 所示。
图 2.4 χ 2 分布密度曲线图
设随机变量 X ~ (0,1), Y ~ χ 2 ( n ),且 X 与 Y 相互独立,则随机变量
服从自由度为 n 的 t 分布,记为 T ~ t ( n )。
其密度函数为:
这是一个偶函数,图形关于 y 轴对称,如图 2.5 所示。
图 2.5 t 分布与标准分布密度曲线
下面给出 t 分布的性质。
性质
1 设
T
~
t
(
n
),当
n
>2时,
ET
= 0,
DT
=
。
性质
2 设
f
(
x
)为
t
分布的密度函数,则
。
此性质说明,当 n →+∞时, t 分布的极限是标准正态分布。在实际应用中,一般,当 n >30时, t 分布与标准正态分布非常接近,但对较小的 n ,两者有较大的差异, t 分布与标准正态分布的期望相同都为 0,但 t 分布的方差比标准正态分布的方差大,因此, t 分布的取值要分散一些。 t 分布又称学生分布。
F 分布是费希尔首先提出, F 取自他名字的首字母。
设 X ~ χ 2 ( m ), Y ~ χ 2 ( n ),且 X , Y 相互独立,则称随机变量
服从自由度为( m , n )的 F 分布,记为 F ~ F ( m , n )。
其密度函数为:
密度分布曲线如图 2.6 所示。
图 2.6 F 分布密度曲线
F 分布的性质有:
性质
1 若
F
~
F
(
m
,
n
),则
~
F
(
n
,
m
)。
性质 2 设 X ~ F ( m , n ),则
性质 3 设 T ~ F ( m , n ),则 T 2 ~ F (1, n )。