实际问题总是认为总体分布形式已知,而是不知其中几个参数,因此估计问题变为如何估计这几个未知参数,分成两大类:点估计和区间估计。
设总体 X 的分布函数 F ( x , θ )形式已知, θ 为待估未知参数向量。设样本值为 x 1 , x 2 ,…, x n ,其点估计就是构造一个适当的统计量 作为待估未知参数, θ 的近似值。这^
里介绍经典的两种方法:矩估计方法和最大似然估计。
矩估计:子样的 k 阶原点矩, ,总体的 k 阶原点矩 m k ,假设 θ = ( θ 1 , θ 2 ,…, θ n ),那么就列 L 个方程 m k = A k ,求解 。
由上面的 m 个方程解出的 m 个未知参数 为参数 的^矩估计量,矩估计量的观察值称为矩估计值。
设随机变量 X ,其概率密度函数为 f ( X , θ ), θ 为未知参数, θ ∈ Θ 。现已取得 X 的容量为 n 的随机子样( x 1 , x 2 ,…, x n ),定义连续型总体的似然函数为:
似然函数为各个子样观测值概率密度的乘积,其中 x 1 , x 2 ,…, x n 均为已经取得的子样值。似然函数 L ( x 1 , x 2 ,…, x n ; θ )仅为未知参数 θ 的函数,显然, L ( x 1 , x 2 ,…, x n ; θ )越大越有利于结果的发生,即 x 1 , x 2 ,…, x n 越容易被观测到。故应选取 ,使 L ( θ )最大,作为 θ 的估计值。
即应该选取 ,称 为参数θ的最大似然估计值。也可以说, 是子样的函数。
将上述发生概率最大的参数θ作为真实值的估计,那么就是使得似然函数 最大即可,或者 最大,记作
为使得上述最大
采取 =0,来求解 参数向量。
对于同一个未知参数,用不同的方法得到的估计量可能不同,于是提出以下问题:
①应该选用哪一种估计量?
②用何种标准来评价一个估计量的好坏?
这就涉及用什么样的标准来评价估计量的问题,下面介绍几种常用的标准。
1)无偏性
设 是总体X的一个样本, 是包含在总体X的分布中的待估参数,这里 是θ的取值范围。
若估计量 的数学期望 存在,且对于任意 ,有
则称 是 θ 的无偏估计量。
人们不可能要求每一次由样本得到的估计值与真值都相等,但可以要求这些估计值的期望与真值相等,这说明了无偏估计量的合理性。
在科学技术中, 称为以 作为θ的估计的系统误差,无偏估计的实际意义就是无系统误差。
例如,设总体X的数学期望E(X)、方差D(X)存在且未知,又设 是总体X的一个样本,则
这就是说,不论总体服从什么分布,样本均值是总体数学期望E (X)的一个无偏估计量;样本方差 是总体方差D(X)的无偏估计量,而估计量 却不是总体方差D(X)的无偏估计量,因此人们一般取样本方差S 2 作为总体方差D(X)的无偏估计量。
2)有效性
如果在样本容量n相同的情况下, 的观察值较 的观察值更密集在真值θ的附近,那么就认为 较 理想。由于方差是随机变量取值与其数学期望[此时数学期望 ]的偏离程度的度量,所以无偏估计量以方差小者为好,这就引出了估计量的有效性这一概念。
设 都是总体参数θ的无偏估计量。若对于任意 ,有 ,则称 较 有效。
3)一致性
在无偏估计量中,人们以其方差作为衡量其最优的标准,但是无偏估计量方差不一定比有偏估计量的方差小。因此人们想从偏差性(有偏和无偏)和离散性(方差大小)两者兼顾的方式来得到估计量,就是一致性或相合性。
设 是总体参数θ的无偏估计量,若对于任意的 当n→∞时, 依概率收敛于θ,即 , = 0,则称 是总体参数θ的一致(或相合)估计量。
由大数定律可知,样本k阶矩是总体k阶矩的一致性估计量;由切比雪夫不等式可以证明。设 是θ的无偏估计量,且 则 是θ的一致估计量,从而矩估计法得到的估计量一般为一致估计量。
在一定条件下,最大似然估计量具有一致性。
一致性或相合性是对估计量的基本要求,若估计量不具有一致性或相合性,那么不论将样本容量n取得多么大,都不能将θ估计得足够准确,这样的估计量是不可取的。