本节将介绍关于拉格朗日乘子法的预备知识,拉格朗日乘子法可用于求解含等式约束的优化问题。
1.基本原理
含等式约束优化问题的数学模型为
(2.51)
式(2.51)的求解方法可见如下命题。
【命题2.14】 设 和 均为连续一阶可导函数,记向量 是式(2.51)的局部最优解, 是 的梯度向量(即有 ), 是函数 的Jacobian矩阵(即有 ),并且 是行满秩矩阵,则存在 维列向量 满足
(2.52)
【证明】 由于向量 是式(2.51)的局部最优解,它一定也是可行解,于是满足 。另一方面,由于 是 阶行满秩矩阵,其中必然存在 阶子矩阵是可逆的,不失一般性,假设其中前 列构成的子矩阵可逆,则根据隐函数定理可知,在 的某个 -领域内,基于方程组 可以确定将 的前 个变量 表示成关于其后 个变量 的闭式函数,不妨将该函数记为 ,于是下面仅需要考虑对向量 进行优化即可。
现将矩阵 按列分块表示为 ,其中 为 的前 列构成的子矩阵(可逆), 为 的后 列构成的子矩阵,则在向量 处通过对恒等式 求一阶导数可以建立如下等式:
(2.53)
接着将向量 按行分块表示为 。其中, 为 的前 个分量构成的子向量, 为 的后 个分量构成的子向量。由于向量 是式(2.51)的局部最优解,于是有
(2.54)
将式(2.53)代入式(2.54)中可得
(2.55)
若令 ,则有
(2.56)
将式(2.56)中的两个等式合并可得
(2.57)
证毕。
命题2.14间接给出了求解式(2.51)的方法,即拉格朗日乘子法。为了求解式(2.51)可以构造如下拉格朗日函数:
(2.58)
式中, 称为拉格朗日乘子。式(2.51)的最优解 和 需要满足如下等式:
(2.59)
可以将式(2.59)看成关于 和 的方程组,其中的方程个数为 ,未知参数个数也为 。在一些特殊情况下,该方程组存在闭式解,但是在绝大多数情况下,该方程组并不存在闭式解,需要通过数值技术来进行求解。
2.两种数学优化模型
下面将讨论本书涉及的两种数学优化模型,第1种模型存在最优闭式解,第2种模型则不存在最优闭式解。
首先考虑第1种模型。设列满秩矩阵 、正定矩阵 、向量 及向量组 ,相应的数学优化模型为
(2.60)
式(2.60)对应的拉格朗日函数为
(2.61)
式中, ,假设其为列满秩矩阵。根据式(2.59)可知,式(2.60)的最优解 和 应满足如下等式:
(2.62)
由式(2.62)中的第1式可得
(2.63)
将式(2.63)代入式(2.62)中的第2式可得
(2.64)
最后将式(2.64)代入式(2.63)中可得
(2.65)
从上述推导中不难发现,优化模型式(2.60)的最优闭式解存在,这是因为其中的等式约束为线性约束。
接着考虑第2种模型。设列满秩矩阵 、正定矩阵 、向量 、向量组 、对称矩阵组 及标量组 ,相应的数学优化模型为
(2.66)
式(2.66)对应的拉格朗日函数为
(2.67)
根据式(2.59)可知,式(2.66)的最优解 和 应满足如下等式:
(2.68)
由式(2.68)中的第1式可得
(2.69)
将式(2.69)代入式(2.68)中的第2式可得
(2.70)
不难发现,式(2.70)是关于 的非线性方程,需要通过迭代或多项式求根的方式进行数值求解,将 的数值解代入式(2.69)中即可得到最优解 。从上述推导中不难发现,由于 的最优闭式解并不存在,因此优化模型式(2.66)的最优闭式解无法获得,需要利用数值技术进行求解,这是因为其中的等式约束为非线性约束(事实上为二次约束)。