本书将时不变非随机参数的估计方法定义为参数估计方法,这类方法由于不依靠被估计参数的先验信息,也称非贝叶斯方法。常见的参数估计方法主要有两大类:极大似然估计和最小二乘估计,这两类方法在基于到达时间差的目标定位、GPS定位系统等领域中被广泛应用。因此,本节主要针对这两类方法展开介绍。
极大似然(Maximum Likelihood,ML)估计是一种估计非随机参数的常用方法,其通过最大化似然函数来估计参数的值。参数的似然函数为
ML方法通过最大化似然函数(3-74)获得参数的估计结果,可以描述为
式中, x 是未知的常数,带噪声的观测 Z 的函数 是一个随机变量。式(3-75)可以利用下式求解:
最小二乘(Least Squares,LS)估计是另一种常见的针对非随机参数的估计方法。给定线性/非线性量测
式中, z j , j =1,2,…, n 为 n 个量测; h j (·)为量测函数,可以是线性函数或非线性函数; v j ~ N ( 0 , R ), j =1,2,…, n 为量测噪声。
LS估计为最小化以下拟合误差:
式中, W 是一个正定加权矩阵,通常有两种选择,即 W = I 或 W = 。
参数 x 的似然函数为
可以发现,最小化式(3-78)等价于最大化式(3-79),即LS估计等价于ML估计。
根据量测函数 h (·)的类型(线性函数或非线性函数),可以将LS估计分为线性最小二乘估计和非线性最小二乘估计两种方法。
当量测函数 h ( x )为线性函数时,
式中, H 列满秩。在这种情况下,式(3-78)为非线性最小二乘问题。此时, x 的线性最小二乘加权(Weighted LS,WLS)估计为
其对应的最小均方误差矩阵为
式中, K =( H T WH ) -1 H T W 。
当量测函数 h ( x )为非线性函数时,式(3-78)为非线性最小二乘估计问题。处理该问题的方法有很多,主要包括数值方法、两步最小二乘法、量测方程转换近似求解方法及统一线性化方法。本节主要针对这4种方法展开介绍。假设式(3-78)中 W = R -1 ,式(3-78)的优化问题可写为
1)数值方法
数值方法求解一般需要先将非线性函数线性化,然后采用线性最小二乘法迭代求解,如Gauss-Newton或Levenberg-Marquardt方法。在这类方法中,首先在给定点 x 0 处对 h ( x )( h ( x )可导)进行一阶泰勒级数展开:
非线性最小二乘问题(3-83)的求解可以转换为最小化以下拟合误差:
从而可得
通过迭代式(3-86), x 的第 k +1次估计为
式中, 是第 k 次迭代的估计; 。
采用数值方法求解非线性最小二乘估计时,每次迭代都基于量测的线性(仿射)函数,很难得到全局最优解,只能得到局部最优解。
2)两步最小二乘法
部分非线性最小二乘问题可以将非线性问题转换为线性问题,然后通过线性最小二乘估计求解。
针对非线性最小二乘问题(3-83),找到一个函数 y = q ( x ),使 h ( x )= Hy ,其中 H 列满秩,从而得到
式(3-88)的唯一解为
如果 q ( x )可逆,那么 为原非线性最小二乘问题的解;如果 q ( x )不可逆,那么 x 的估计就变成求解维数降低的最小二乘问题。
式(3-90)可通过数值方法求解。
两步最小二乘法将一个维数较大的非线性最小二乘问题(3-83)转换为维数较小的问题(3-90)。该方法的关键是选择 H 和 y = q ( x ),使 h ( x )= Hy ,这依赖于问题本身。只有小部分非线性最小二乘问题可以通过这种方法求解,如基于到达时间差的定位问题。同时,要想使式(3-90)可解,还需要求 H 列满秩。
3)量测方程转换近似求解方法
大多数非线性最小二乘问题都可以通过线性最小二乘估计近似求解。将非线性函数 z=h ( x )转换为线性函数,得到
式中, z 和 θ 可以唯一地确定 y 与 x ,即 y = g 1 ( z )和 x = g 2 ( θ ),那么转换后的数据为
转换后的模型为
根据式(3-93),可得到 θ 的线性最小二乘估计 为
式中, W 可通过转换模型中的 得到, W = 。最后,通过 获得 x 的最小二乘估计为
由于上述基于量测方程转换近似的非线性最小二乘问题求解方法引入了近似,因此其不能得到精确的最小二乘估计,转换模型中噪声 的方程未知,一般仅能得到其近似值,也无法得到最优的加权最小二乘估计。
4)统一线性化方法
上述求解非线性最小二乘问题的方法除了泰勒级数展开的线性化方法,均没有给出通用的线性方法,基于统计线性化思想,对于非线性模型
式中, h (·,·)表示非线性函数; x 为被估计参数; 为量测误差,均值为 ,方差为 。不失一般性,假设 =0。
基于统一线性化的最小二乘估计方法,首先将式(3-96)线性化为
式中, H 和 b 是使 L h ( x , v )最接近 的待定常数; v 是线性化后的量测误差,其与 不同。对于 和 L h ( x , v ),假设:
(1) 是连续可导函数,并且可以由( x 0 ,0)点处的一阶泰勒级数充分近似;
(2) L h ( x , v )与 在 x 0 处的一、二阶矩相等,即
基于假设(1)和假设(2), 的统一线性化形式为
式中, 。
由式(3-98)和式(3-99)可得到 v 的一、二阶矩为
式中, 和 C v 可通过确定性采样方法计算得到,常用的确定性采样方法将在3.5.3节中介绍,此处不再赘述;(·)表示该项与其左边的一项相同。利用确定性采样方法, 和 C v 可分别写为
式中, h j = , 为确定性采样点; α j 为采样点 对应的权值。不同的确定性采样方法的主要区别在于获得采样点和权值的方法不同。
使用式(3-99)代替原始非线性函数 ,则 x 的基于统一线性化的最小二乘(Linearized Least Squares,LLS)估计的优化函数可写为
式中, = z-h ( x 0 ,0) 。
通过求解式(3-102)可得到 x 的最小二乘估计和估计误差分别为
线性最小二乘估计(3-81)、一阶泰勒级数展开的线性模型(3-84)及转换后的线性模型(3-88)均可看作统一线性化模型(3-97)的特殊情况。如果函数 为线性模型,那么基于统一线性化的最小二乘估计可以退化为线性最小二乘估计。