实际问题总是认为总体分布形式已知,而是不知其中几个参数,因此估计问题变为如何估计这几个未知参数,分成两大类:点估计和区间估计。
设总体
X
的分布函数
F
(
x
,
θ
)形式已知,
θ
为待估未知参数向量。设样本值为
x
1
,
x
2
,…,
x
n
,其点估计就是构造一个适当的统计量
作为待估未知参数,
θ
的近似值。这^
里介绍经典的两种方法:矩估计方法和最大似然估计。
矩估计:子样的
k
阶原点矩,
,总体的
k
阶原点矩
m
k
,假设
θ =
(
θ
1
,
θ
2
,…,
θ
n
),那么就列
L
个方程
m
k
= A
k
,求解
。
由上面的
m
个方程解出的
m
个未知参数
为参数
的^矩估计量,矩估计量的观察值称为矩估计值。
设随机变量 X ,其概率密度函数为 f ( X , θ ), θ 为未知参数, θ ∈ Θ 。现已取得 X 的容量为 n 的随机子样( x 1 , x 2 ,…, x n ),定义连续型总体的似然函数为:
似然函数为各个子样观测值概率密度的乘积,其中
x
1
,
x
2
,…,
x
n
均为已经取得的子样值。似然函数
L
(
x
1
,
x
2
,…,
x
n
;
θ
)仅为未知参数
θ
的函数,显然,
L
(
x
1
,
x
2
,…,
x
n
;
θ
)越大越有利于结果的发生,即
x
1
,
x
2
,…,
x
n
越容易被观测到。故应选取
,使
L
(
θ
)最大,作为
θ
的估计值。
即应该选取
,称
为参数θ的最大似然估计值。也可以说,
是子样的函数。
将上述发生概率最大的参数θ作为真实值的估计,那么就是使得似然函数
最大即可,或者
最大,记作
为使得上述最大
采取
=0,来求解
参数向量。
对于同一个未知参数,用不同的方法得到的估计量可能不同,于是提出以下问题:
①应该选用哪一种估计量?
②用何种标准来评价一个估计量的好坏?
这就涉及用什么样的标准来评价估计量的问题,下面介绍几种常用的标准。
1)无偏性
设
是总体X的一个样本,
是包含在总体X的分布中的待估参数,这里
是θ的取值范围。
若估计量
的数学期望
存在,且对于任意
,有
则称
是
θ
的无偏估计量。
人们不可能要求每一次由样本得到的估计值与真值都相等,但可以要求这些估计值的期望与真值相等,这说明了无偏估计量的合理性。
在科学技术中,
称为以
作为θ的估计的系统误差,无偏估计的实际意义就是无系统误差。
例如,设总体X的数学期望E(X)、方差D(X)存在且未知,又设
是总体X的一个样本,则
这就是说,不论总体服从什么分布,样本均值是总体数学期望E (X)的一个无偏估计量;样本方差
是总体方差D(X)的无偏估计量,而估计量
却不是总体方差D(X)的无偏估计量,因此人们一般取样本方差S
2
作为总体方差D(X)的无偏估计量。
2)有效性
如果在样本容量n相同的情况下,
的观察值较
的观察值更密集在真值θ的附近,那么就认为
较
理想。由于方差是随机变量取值与其数学期望[此时数学期望
]的偏离程度的度量,所以无偏估计量以方差小者为好,这就引出了估计量的有效性这一概念。
设
都是总体参数θ的无偏估计量。若对于任意
,有
,则称
较
有效。
3)一致性
在无偏估计量中,人们以其方差作为衡量其最优的标准,但是无偏估计量方差不一定比有偏估计量的方差小。因此人们想从偏差性(有偏和无偏)和离散性(方差大小)两者兼顾的方式来得到估计量,就是一致性或相合性。
设
是总体参数θ的无偏估计量,若对于任意的
当n→∞时,
依概率收敛于θ,即
,
= 0,则称
是总体参数θ的一致(或相合)估计量。
由大数定律可知,样本k阶矩是总体k阶矩的一致性估计量;由切比雪夫不等式可以证明。设
是θ的无偏估计量,且
则
是θ的一致估计量,从而矩估计法得到的估计量一般为一致估计量。
在一定条件下,最大似然估计量具有一致性。
一致性或相合性是对估计量的基本要求,若估计量不具有一致性或相合性,那么不论将样本容量n取得多么大,都不能将θ估计得足够准确,这样的估计量是不可取的。