《暨南经济文丛·最优化与高级宏观经济学》

第2章
离散时间、有限期界的动态最优化

前一章处理的问题只涉及一个时点，属静态最优化问题；现实中的诸多问题涉及多个时点甚至连续时间的资源分配，属动态最优化问题。本章讨论离散时间、有限期界的动态最优化问题及其解法，下一章我们将分析连续时间、无限期界的动态最优化问题。

2.1 动态最优化问题

本节介绍动态分析中最典型的问题及其三种解法（变分法、最大值原理与动态规划）的基本思想。

2.1.1 动态分析中的典型问题

规划者要制订一个 T 期的计划，确定各期的消费与资本保有量，使计划期内效用达到最大，即

(P)

这是最典型的离散时间的动态问题。其中 x _t 表示控制变量（消费）， k _t 表示状态变量（资产存量）， T 表示计划的期间， u （ t ， k _t ， x _t ）表示 t 期的效用， ν （ T ， k _T ）表示期终残存资产的效用的现在价值。第一个约束是状态变量的运动方程，表示家庭资产的变动依赖于期初资产、利息率、支出额与收入额；然后是环境制约，如资产存量非负、劳动供给非负、消费需预付现金等约束；最后是期初条件。

2.1.2 典型问题的三种解法

变分法主要适用于求解这样的问题：约束条件 g （ t ， k _t ， x _t ）≥0； t =0，1，…， T -1未起作用，且目标函数最大化的手段只依赖于状态变量的路径（ k _t ₊₁ -k _t = x _t ），即求解下述问题：

(P _V )

变分法通过引入微小的变化来推导最优解的性质，如著名的Euler差分方程式等。该方法的特点是直观、有效、易于理解。

运用最大值原理（Maximum Principle）求解时，并不把 t 看成历史时间，而是将其看作外生变量，也就是说，不是把 x _t 与 k _t 看作随时间变化的变量，而是将 x ₀ ， x ₁ …， x _T _-1 ； k ₁ ，…， k _T 看成独立的变量，把状态方程与环境约束通通看成约束条件。将（P）看成静态问题（NLP），采用（NLP）的方法进行求解。

最大值原理的特点是以状态运动方程的拉格朗日乘数的形式引入共状态变量，动态问题与时间分离，Hamilton函数的使用与共状态变量的引入使最优条件的表达式简洁化。

动态规划方法则注重历史的时间推移，也就是说，运用动态规划解决的问题需要被一期一期地依次解决。

动态规划方法的特点是，基于状态变量导入价值函数，该函数能使各期的决定问题简单化。

以上三种方法相互补充，Euler方程、共状态变量与价值函数相互关联。

2.2 变分法

变分法常用来分析如下的离散时间问题：

(P _V )

与典型问题相比，变分法讨论的问题没有环境约束，控制变量 x _t = k _t ₊₁ -k _t ， k _T 固定， u 连续可微。

若 y ^∗ 为最优解，则 =0，即

也即

必须成立，其中 t =0，1，…， T -1。该式称为Euler差分方程式。

上述Euler差分方程式为二阶，因此若两个时点的 k _t 确定了，比如 k ₀ 与 k ₁ 确定了， k _t 的整个时间路径也就确定了。由于该问题给出了初始条件与终端条件，因此{ k _t ： t =0，1，…， T }的路径也就完全确定了。

2.3 最大值原理

2.3.1 非线性规划问题与最大值原理

采用如下记号：

于是动态最优化问题（P）与下述混合型（NLP）相同：

混合型（NLP）既含不等式约束也含有等式约束。因此，前一章中与混合型（NLP）对应的库恩塔克条件也适用于（P）。

定义：若的行向量线性无关，则说 G ， H 在 X 满足混合型（NLP）的正则条件。这里 I （ X ）={ i｜G _i （ X ）= B _i }。

定理1：假定 X ^∗ 为混合型（NLP）的最优解， F ， G ， H 连续可微，且 G ， H 在 X ^∗ 满足正则条件，则存在 λ ^∗ ， ξ ^∗ 使得：

成立。其中 L （ X ， λ ， ξ ）= F （ X ）+ λ ［ B-G （ X ）］+ ξH （ X ）。

定义：记 I （ X ）={ i｜G _i （ X ）=0}，若与的要素向量线性无关，则称 f ， g 在 X 满足动态问题（P）的正则条件。

下面我们要证明：若 f ， g 在最优解 X ^∗ 满足动态问题（P）的正则条件，则混合型（NLP）的库恩塔克条件是最优解的必要条件。

首先构造拉格朗日函数

其中 H （ t ， k _t ， x _t ， λ _t ）= u （ t ， k _t ， x _t ）+ λ _t f （ t ， k _t ， x _t ）称为现值的Hamilton函数。因此，对于 t =0，1，…， T -1，库恩塔克条件如下：

若 x ^∗ 是最优解，则存在{ ： t =0，1，…， T }与{ ： t =0，1，…， T -1}使以上八式成立。

于是我们有下述定理：

定理2（最大值原理的必要性）：在问题（P）中，假定 u ， ν ， f ， g 分别关于各独立变量连续可微，且 f ， g 满足动态问题（P）的正则条件。若{ ： t =0，1，…， T -1}与{ ： t =0，1，…， T }是问题（P）的最优解，则存在{ ： t =-1，…， T -1}与{ ： t =0，1，…， T -1}使以下四个条件成立：

（1）Hamilton函数最大化的库恩塔克条件：

（2）Hamilton动力学：

（3）横截性条件（Transversality Condition）：

（4）初期条件：

问题（P）的最优解的必要条件（1）～（4）称为最大值原理。

需要说明的是，拉格朗日乘数与状态变量相对应，又称为共状态变量。它表示最优投资的边际1单位增加所引起的总效用的增量，因此是投资品的边际价值或投资品的影子价格。

2.3.2 混合型（ NLP ）的库恩塔克条件与鞍点条件

混合型（NLP）：

稍作变换即可化为（NLP）的标准问题：

不过， h （ x ）与 -h （ x ）一般不能同时为凸函数，除非 h （ x ）是线性的。因此第1章中约束函数为凸时库恩塔克条件的充分性定理（第1章定理10）以及约束函数为凸且满足Slater条件时的库恩塔克条件的必要性定理（第1章定理9）若要成立，要求 h （ x ）必须是线性函数。

与之相对，满足正则性时的库恩塔克条件的必要性定理（第1章定理8）与满足鞍点条件的解为最优解的充分性定理（第1章定理13）依然成立。

记 I （ x ）={ i｜g _i （ x ）= b _i }，若与的要素向量线性无关，则称 g ， h 在 x 满足混合型（NLP）的正则条件。

记 L ⁺ （ x ， λ ， μ ， φ ）= f （ x ）+ λ ［ b-g （ x ）］+ μ ［0 -h （ x ）］+ φ {0-［ -h （ x ）］}，则混合型（NLP）的库恩塔克条件可表示为：

若记 L （ x ， λ ， ξ ）= f （ x ）+ λ ［ b-g （ x ）］+ ξh （ x ），则上述条件与下述条件等价：

定理3：对于 x ^∗ ，若存在 λ ^∗ 与 ξ ^∗ 满足库恩塔克条件，并且（i） f （ x ）， -g （ x ）， h （ x ）连续可微、凹；（ii） ξ ^∗ ≥0，则 x ^∗ 为混合型（NLP）的最优解。

证明：考虑满足（NLP）约束条件 g （ x ）≤ b ， h （ x ）=0的 x ，由 f （ x ）的凹性知

因此

上式第二行取等号是由于库恩塔克条件的第一式成立；第三行取大于等于号是由于 -g （ x ）， h （ x ）的凹性假定；最后一行取大于等于号是由于 g （ x ）≤ b ， h （ x ）=0， h （ x ^∗ ）=0以及 λ ^∗ [ b-g （ x ^∗ ）]=0。

该定理中 f 若严格凹，则最优解是唯一的。

定理4：对于 x ^∗ ，若存在 λ ^∗ ≥0 与 ξ ^∗ ，使对任意的 x ∈ R ⁿ ， λ ≥0， λ ∈ R ^m 以及 ξ ∈ R ^l 都有：

成立，则 x ^∗ 为混合型（NLP）的最优解。

证明：我们首先证明 x ^∗ 满足约束条件，再证明对满足约束条件的任意 x 都有 f （ x ）≤ f （ x ^∗ ）即可。

第二个不等式意即

f ( x ^∗ )+ λ ^∗ [ b-g ( x ^∗ )]+ ξ ^∗ h ( x ^∗ )≤ f ( x ^∗ )+ λ [ b-g ( x ^∗ )]+ ξh ( x ^∗ )

因此对任意的 λ ≥0以及 ξ 均有：

特别地，让 λ _j = λ ^∗ _j +1， j = i ； λ _j = λ ^∗ _j ， j ≠ i ； ξ = ξ ^∗ ，则 b _i ≥ g _i （ x ^∗ ）。对每一个 i 都如是操作，我们有

于是 λ ^∗ [ b-g （ x ^∗ ）]≥0。

（∗）式中若令 λ =0， ξ = ξ ^∗ ，则有 λ ^∗ [ b-g （ x ^∗ ）]≤0，于是

下面让 λ = λ ^∗ ； ξ _j = + ε ， j = i ； ξ _j = ， j ≠ i ，于是由（∗）式， εh _i （ x ^∗ ）≥0。 ε 可正可负，因此 h _i （ x ^∗ ）=0，这对所有的 i 均成立，于是

这就是说 x ^∗ 满足（NLP）的约束条件。

对于满足 g （ x ）≤ b ， h （ x ）=0的任意 x ，由于 x 满足鞍点条件的第一个不等式，所以

第二行成立是因为 λ ^∗ ≥0， g （ x ）≤ b ， h （ x ）=0， h （ x ^∗ ）=0，以及 λ ^∗ [ b-g （ x ^∗ ）]=0。

2.3.3 最大值原理的充分性

沿用2.3.1节的记号。显然有：

（1）若 g （ t ， k _t ， x _t ）关于 k _t ， x _t 连续可微、凹，则 -G （ X ）关于 X 连续可微、凹；

（2）若 f （ t ， k _t ， x _t ）关于 k _t ， x _t 连续可微、凹， f （ t ， k _t ， x _t ）+ k _t -k _t ₊₁ 关于 k _t ₊₁ ， k _t ， x _t 连续可微、凹，因此 H （ X ）关于 X 连续可微、凹；

（3）若 u （ t ， k _t ， x _t ）关于 k _t ， x _t 连续可微、凹，而且 ν （ T ， k _T ）关于 k _T 连续可微、凹，则 F （ X ）关于 X 连续可微、凹。

注意到以上三点，由定理3我们得：

定理5（最大值原理的充分性）：对于问题（P）中的{ ： t =0，1，…， T -1}与{ ： t =0，1，…， T }，若存在{ ： t =-1，…， T -1}与{ ： t =0，1，…， T -1}，满足：

①定理2中的四个条件；②{ λ ^∗ _t ≥0： t =-1，…， T -1}；③ g （ t ， k _t ， x _t ）、 f （ t ， k _t ， x _t ）和 μ （ t ， k _t ， x _t ）关于 k _t ， x _t 、 ν （ T ， k _T ）关于 k _T 连续可微、凹。