目标函数的值是评价设计方案优劣的指标。n维变量的目标函数,其函数图像只能在 n +1维空间中描述出来。当给定一个设计方案,即给定一组 x 1 , x 2 ,…, x n 的值时,目标函数 f ( X )= f ( x 1 , x 2 ,…, x n )必相应有一确定的函数值;但若给定一个 f ( X )值,却有无限多组 x 1 , x 2 ,…, x n 值与之对应,也就是当 f ( X )= a 时, X =( x 1 , x 2 ,…, x n ) T 在设计空间中对应有一个点集。通常这个点集是一个曲面(二维是曲线,大于三维称为曲面),称之为目标函数的等值面。当给定一系列的 a 值,取 a = a 1 , a 2 ,…时,相应地有 f ( X )= a 1 , a 2 ,…,这样可以得到一组超曲面族——等值面族。显然,等值面具有下述特性,即在一个特定的等值面上,尽管设计方案很多,但每一个设计方案的目标函数值却是相等的。
现以二维无约束最优化设计问题为例阐明其几何意义。如图2-1所示,二维目标函数值 f ( X )= f ( x 1 , x 2 )在以 x 1 、 x 2 和 f ( X )为坐标的三维坐标系空间内是一个曲面。在二维设计平面 x 1 O x 2 中,每一个点 X =( x 1 , x 2 )都有一个相应的目标函数值 f ( X )= f ( x 1 , x 2 ),它在图中反映为沿 f ( X )轴方向的高度。若将 f ( X )= f ( x 1 , x 2 )面上具有相同高度的点投影到设计平面 x 1 O x 2 上,则得 f ( X )= f ( x 1 , x 2 )= a 的点集,称为目标函数的等值线(等值线是等值面在二维设计空间中的特定形态)。当给定一系列不同的 a 值时,可以得到一组平面曲线: f ( X )= f ( x 1 , x 2 )= a 1 , f ( X )= f ( x 1 , x 2 )= a 2 ,…,这组曲线构成目标函数的等值线族。由图可以清楚地看到,等值线的分布情况反映了目标函数值的变化情况,等值线越向里,目标函数值越小,对于一个有中心的曲线族来说,目标函数的无约束极小点就是等值线族的一个共同中心 X * 。故从几何意义上说,求目标函数无约束极小点也就是求其等值线族的共同中心。
以上二维设计空间等值线的讨论,可以推广到分析多组问题。但需注意,对于三维问题在设计空间中是等值面,高于三维的问题在设计空间中则是等值超曲面。
n维目标函数 f ( X )= f ( x 1 , x 2 ,…, x n ),若在无约束条件下极小化,即在整个 n 维设计空间寻找 X * =( x 1 * , x 2 * ,…, x n * ) T ,使满足min f ( X )= f ( X * ), X ∈R n ,其最优点 X * 、最优值 f ( X * )构成无约束最优解;若在约束条件限制下极小化,即在可行域中寻找 X * =( x 1 * , x 2 * ,…, x n * ) T ,使满足min f ( X )= f ( X * ), X ∈R n ,其最优点 X * 、最优值 f ( X * )构成约束最优解,无论在数学模型还是几何意义上,两者均是不同的概念。
现用一个二维非线性最优化问题,从几何意义上来说明约束最优解和无约束最优解。
设已知目标函数 f ( X )= x 2 1 + x 2 2 -4 x 1 +4,受约束于 g 1 ( X )= x 1 - x 2 +2≥0, g 2 ( X )= x 1 ≥0, g 3 ( X )= x 2 ≥0, g 4 ( X )=- x 2 1 + x 2 -1≥0,求其最优解 X * 和 f ( X * )。图2-1a表示其目标函数和约束函数的立体图,图2-1b表示其平面图。当目标函数 f ( X )=0.25、1、4、6.25时,相应在 x 1 O x 2 设计平面内得一系列平面曲线(同心圆)——等值线,它表示了目标函数值的变化情况,越向里边的代表目标函数值越小。显然其无约束最优解为目标函数等值线同心圆中心 X *(1) =( x 1*(1) , x 2 *(1) ) T =(2,0) T , f (X *(1) )=0。而其约束最优解则需在由约束线 g 1 ( X )=0, g 2 ( X )=0, g 3 ( X )=0, g 4 ( X )=0组成的可行域(阴影线里侧)内寻找使目标函数值为最小的点,由图可见,约束线 g 4 ( X )=0与某等值线的一个切点 X *(2) 即为所求, X *(2) =( x 1 *(2) , x 2 *(2) ) T =(0.58,1.34) T , f ( X *(2) )=3.8为其约束最优解。
图2-1 二维函数的约束最优解和无约束最优解
以上二维问题关于约束最优解和无约束最优解几何意义的讨论,同样可以推广到多维问题。 n 个设计变量( x 1 , x 2 ,…, x n )组成设计空间。在这个空间中的每个点代表一个设计方案。此时n个变量有确定的值。当给定目标函数某一值时,就在 n 维设计空间内构成一个目标函数的等值超曲面,给定目标函数一系列数值时就得一系列目标函数的等值超曲面。这些等值超曲面反映了目标函数的变化情况。无约束最优点为这些等值超曲面的共同中心。对于约束最优化问题,每一个约束条件在n维设计空间中是一个约束超曲面,全部约束超曲面在设计空间中构成可行域。在其上寻找目标函数值最小的点即为约束最优点。这一点可以是目标函数等值超曲面与某个约束超曲面的一个切点,也可以是目标函数值较小的某些约束超曲面的交点(如图2-2所示的X * 点)。
图2-2 n 维问题的约束最优点和无约束最优点
对无约束最优化问题,当目标函数不是单峰函数时,有多个极值点 X *(1) , X *(2) ,…,如图2-3所示。此时, X *(1) 和 f (X *(1) )、 X *(2) 和 f ( X *(2) )均称为局部最优解。如其中 X *(1) 的目标函数值 f ( X *(1) )是全区域中所有局部最优解中的最小者,则称 X *(1) 和 f ( X *(1) )为全域最优解。
对于约束最优化问题,情况更为复杂,它不仅与目标函数的性质有关,还与约束条件及其函数性质有关。如图2-4所示,将目标函数 f ( X )的等值线绘于图上,由两个不等式约束 g 1 ( X )≥0、 g 2 ( X )≥0构成两个可行域 D 1 和 D 2 。 X *(1) 、 X *(2) 、 X *(3) 分别是可行域内在某一邻域目标函数值最小的点,都是局部极小点,亦即 X *(1) 、 f ( X *(1) ), X *(2) 、 f ( X *(2) ), X *(3) 、 f ( X *(3) )均称为局部最优解。由于 f ( X *(1) )< f ( X *(2) )< f ( X *(3) ),可知 X *(3) 为全域极小点,亦即 X *(3) 和 f ( X *(3) )为全域最优解。
优化设计总是期望得到全域最优解,但目前的优化方法只能求出局部最优解,并采取对各局部最优解的函数值加以比较,取其中最小的一个作为全域最优解。
图2-3 无约束优化的全域和局部最优解
图2-4 约束优化的全域和局部最优解