工业装备系统亚健康诊断方法最新章节_张利著

3.3 学习算子设计与改进

3.3.1 GA-BP编码方式

针对不同的问题，设计一套恰当的编码方案，对遗传算法的实现细节起到不可估量的作用。一般地，设计一套编码方案应满足以下三条原则。

（1）完备性：问题空间的任意一个可行解都能被编码串表示出来。

（2）健全性：所设计的任意一个编码串都能对应到问题空间的可行解中。

（3）非冗余性：编码串与可行解之间是一一对应的。

对于众多的实际问题，很难设计出能够同时满足以上三条原则的编码方案，但无论如何，任意一套编码方案必须满足完备性原则。

随着算法的广泛应用，已经提出很多编码方案，其中主要有下面几种。

1 .二进制编码

二进制编码是一种最主要的编码方法，把问题空间的可行解映射成算法可以处理的0、1组成的位串。它的优点是：编码、解码操作简单易行，使交叉、变异等操作便于实现；满足最小字符集编码原则；便于对算法从理论方面进行分析。

2 .浮点编码

染色体被编码成一个浮点数，问题空间与编码空间是一致的，通过浮点数即可反映出问题的规律。它的优点是：计算精度与编码本身无关；能处理非常规约束。

3 .格雷（ Gray ）编码

它是一种二进制编码的变化形式，格雷码在具备了二进制编码的全部优点的同时，还提高了自身的局部搜索能力。

由于神经网络权值的取值范围在（0，1），用遗传算法优化网络的权值，染色体编码串的长度=输入节点数×隐含层节点数+隐含层节点数×输出层节点数。对于基于数据驱动的健康状态诊断方法而言，问题本身比较复杂，用于诊断的网络模型的节点数相对较多，由此染色体位数较高。考虑到这些因素，本章采用浮点数编码方式，一方面便于直接表示权值，不丢失解码精度；另一方面降低编码负担，方便计算。

3.3.2 适应度函数的设计

适应度函数是根据具体问题的目标函数来确定的，用于对染色体进行评价，同时选择策略也是依据适应度值进行操作的。生物体的进化过程遵循“优胜劣汰”的原则，即生物体的进化方向总是朝着个体适应度值增长的方向进行进化。这也是设计适应度函数时必须满足的条件 ^[16] 。

误差函数作为BP神经网络的一个重要性能指标，其值越小，表明实际输出与期望输出差距越小，即网络性能越稳定。因此，用遗传算法优化神经网络时，最为常见的适应度函数的设计形式为：

式中，y _k ，k=1，2，…，N为神经网络训练得到的预测值；为神经网络训练得到的实际结果。

为了防止进化初期随机生成的初始种群中的特殊个体统治整个群体，误导群体的发展方向，本章以线性调整原理为依据，对适应度值做如下的线性调整：

式中，f _max 和 f _min 分别是当代种群中最大、最小的适应度值；f 为当前个体的适应值；f′为修改后的个体适应值；β为调节系数。

由图3-1可知，当前种群中适应度的差值变大时，夹角α会变小，即个体适应度可调整的范围就会变小，也就是说种群中个体间的适应度差距降低，这样就有效防止了超正常个体统治整个群体；反之，则可调整的范围变大，从而拉开群体中个体间的差距，从而避免算法在最优解附近发生振荡现象。

图3-1 适应度调整

3.3.3 选择算子的设计

下面列举了几种常见的选择策略，已经MATLAB编程实现。

1 .轮盘赌选择（ Roulette Wheel Selection ）

任意个体被选择的概率与自身的适应度值的大小成正相关，但是又不保证适应度值大的个体一定会被选择，因为该策略是一种随机策略。

设群体大小为m，其中个体i的适应度为 f _i ，则个体被选择的概率P _Si 为：

2 .最优保存策略（ Elitist Strategy ）

该策略保证了适应度最大的个体一定被遗传到下一代，但是却牺牲了种群多样性。其基本思想是：从当前群体中选择适应度值最大的个体，直接替换掉经过交叉和变异操作后的新种群中适应度最低的个体。

3 .随机联赛选择（ Stochastic Tournament ）

该策略只比较适应度值的大小，且没有算术操作，其基本思想是：对种群随机地进行划分，并选择每一分块中适应度值最高的个体遗传到下一代群体中。

4 .期望值方法（ Expectancy Method ）

其基本思想是：按下式计算每一个体的期望选择率：

当某一个体被选中时，按下式对期望生存进行调整：

经调整后，凡是期望选择率小于等于零的个体都不参与选择操作。

针对具体的问题，酌情筛选使用的策略，可单独使用，也可混合使用。本章采用轮盘赌方法与最优保存相结合的混合策略，这样不仅克服了单一轮盘赌方法的适应度较高的个体选不中的问题，而且也能弥补以丢失样本多样性为代价的最优保存法因陷入某局部最优个体而影响算法全局搜索能力的缺陷，同时，混合后的选择策略还会提高算法的计算效率。