本书研究总体框架如图1.4所示,围绕低维决策空间和高维决策空间中的串行函数评估、获取函数优化效率低、维度灾难和边界问题等关键问题,针对求解昂贵的多目标优化问题的贝叶斯优化方法展开了四方面的研究。本书的具体研究内容如下。
第一,提出了基于自适应采样的批量多目标贝叶斯优化方法。该方法将经典的多目标贝叶斯优化方法即序列化ParEGO扩展到批处理模式,用于求解昂贵的多目标优化问题。具体而言,该方法利用双目标获取函数推荐和评估多个候选解。双目标获取函数从多目标优化角度出发,将利用和探索作为两个优化目标,然后利用多目标进化算法对两者进行平衡。由于现实世界中通常只有固定数量的有限硬件资源,所以该方法进一步提出了自适应候选解选择策略,以固定每个迭代中候选解的数量。该策略通过调整利用-探索适应值函数中的超参数,动态地平衡利用和探索之间的关系。此外,该方法利用EI推荐另一个候选解,以确保算法收敛性和鲁棒性。与其他多目标贝叶斯优化方法相比,三个多目标标准合成测试集和一个神经网络超参数调优任务上的结果验证了该方法的有效性。分析表明,对于昂贵的多目标优化问题,带有自适应推荐策略的双目标获取函数可以在批处理模式下很好地平衡利用和探索之间的关系。
图1.4 本书研究总体框架
第二,提出了基于块坐标更新的高维多目标贝叶斯优化方法。该方法首先将决策变量空间划分为不同的块,每个块包含一个低维子多目标优化问题。在每个算法迭代中,该方法只考虑一个块中的决策变量,不在该块中的决策变量的值通过嵌入帕累托先验知识的上下文向量近似,从而促进收敛性。为了解决高维决策空间中的边界问题,该方法从贝叶斯优化和多目标优化的角度出发,提出了 ε- 贪心获取函数用于候选解推荐。 ε- 贪心获取函数要么从利用-探索平衡的角度推荐候选解,要么以概率 ε 从帕累托支配关系的角度推荐候选解。为了验证该方法的有效性,将其与其他多目标贝叶斯优化方法在运输系统的实际优化问题和三个多目标合成测试问题上进行了对比。实验结果表明,与其他方法相比,该方法可以以更低的计算复杂度在整个搜索空间中搜索到分布更均匀的非支配解。分析表明,块坐标更新和ε-贪心获取函数分别能够降低计算复杂度和更好地平衡收敛性与多样性。
第三,提出了基于可加高斯结构的高维多目标贝叶斯优化方法。该方法首先将高维昂贵的多目标优化问题中的多个子目标聚合为单一目标。然后,该方法利用贝叶斯推理,在给定决策空间划分先验知识的情况下推导出最终的决策空间划分。最后,该方法利用可加高斯结构引入可加双目标获取函数,实现了决策空间降维和并行化函数评估,在高维决策空间中更好地利用了并行硬件计算资源。在两个标准多目标合成测试集上与其他三种基于EGO的多目标优化方法(即ParEGO、SMS-EGO和MOEA/D-EGO)的对比实验结果表明,该方法在求解高维昂贵的多目标优化问题时,能以较低的计算复杂度更高效地优化高维决策空间中的获取函数。
第四,提出了基于变量交互分析的高维多目标贝叶斯优化方法。该方法利用变量交互分析模型确定决策空间是否可分,然后在决策子空间中进行局部贝叶斯优化。通过变量分析模型,该方法可以学习原多目标问题是否可分,该学习过程基于决策变量之间潜在的交互关系,不需要任何过强的假设。与其他多目标贝叶斯优化方法在标准合成测试问题上的对比实验结果表明,该方法在近似高维昂贵的多目标优化问题的帕累托前沿方面明显优于其他基线方法。