心智探奇：人类心智的起源与进化最新章节_史蒂芬·平克著

遗传算法的威力

我们所要讨论的第一个问题是人脑为什么会进化？答案就在信息的价值中，大脑就是设计用来处理信息的。

每次你买报纸时，你都在为信息付费。经济学家解释了为什么应该这么做：因为信息传递的收益值得付费。生命是赌博中的机会。在岔路口往左拐还是往右拐，与瑞克待在一起还是与维克托一同离开，人们知道哪个选择都不能保证好运和幸福；人们所能做的只有碰运气。究其本质，生命中的每个决策都可以归结为买哪张彩票。比方说，一张彩票花1美元，有1/4的机会中10美元。平均来说，你每玩一次会净赚1.5美元（10美元除以4等于2.5美元，再减去1美元的买彩票成本）。另一张彩票价格1美元，有1/5的机会可以中12美元。平均下来，你每次会赚1.4美元。两种彩票数目相同，上面都没有标注中奖的概率。如果有人可以告诉你哪张是哪种彩票，你会付他多少钱？你至多可以付他4美分。没有信息的话，你将需要随机抽取，估计平均会赚1.45美元（一半时间1.5美元，一半时间1.4美元）。如果你知道哪张有更好的平均收益，你每次就会平均赚1.5美元，所以即使你付出4美分，你每次还会多赚1美分。

绝大多数生物体不买彩票，但每当它们的身体能够以不止一种方式运动时，它们都在投注选择。如果成本低于在食物、安全、求偶机会，以及其他资源方面的预期收益，它们应当会愿意“付费买”信息——这些“费用”包括组织、能量和时间。所有收益的评价方式最终都根据能否提高后代预期生存数量。在多细胞动物中，信息是由神经系统搜集的，并转化为能获益的决策。

更多的信息往往会带来更大的回报，并赢回额外的成本。如果一个财宝箱被埋在你家附近的某个地方，那么仅仅一条告诉它被埋在北半边还是南半边的信息就很有帮助，因为这节省了你一半的挖掘时间。告诉你它在哪个象限的信息会更有用，等等。坐标上有越多的数字，你就会越少浪费时间，所以你就会愿意付钱得到更多的信息，直到那一点已经非常接近，而不值得再花成本去做更小的细分为止。与之类似，如果你要破解一个密码锁，你拥有的每个数字都会减少需尝试的次数，因而节省的时间会抵消付出的成本。因此往往信息越多越好，直到收益递减的那一点，这就是为什么有些谱系的动物进化出越来越复杂的神经系统。

自然选择不能给生物体关于它所处环境的信息或是关于计算网络、小幽灵（后台程序）、模块、技能、表征或处理信息的心智器官的信息。它只能在基因之间选择。但基因构建了大脑，且不同的基因构建了以不同方式处理信息的大脑。信息处理的进化必须在螺母和螺栓层次，通过选择影响脑加工处理的基因才能实现。

许多种类的基因会因其更好的信息处理能力而成为自然选择的目标。修改过的基因会沿着脑室壁（脑中心的洞）产生不同数量的增殖单位，这会产生制造灰质的皮质神经元。其他的基因会允许增殖单位为不同数目的周期而分开，创造出不同数量和种类的皮质区域。借由移动一些化学物质轨迹和分子建构的路标等方式，用来联结神经元的神经轴可以被诱导往不同的方向上移动，进而完成将神经轴重新布线的目的。基因可以改变分子构成的锁钥结构，以便鼓励一些神经元和其他神经元进行联结。就像那个关于如何雕刻大象雕塑的老笑话中讲的（去掉所有看上去不像大象的部分），神经回路能够通过将程序设计为某种细胞和突触适时的自杀而塑造。神经元能够在胚胎发育的不同时间点变得活跃，它们的激活模式，无论是自发的还是程序设计的，都可以在下游被解释为关于如何连线在一起的信息。许多这些过程在级联中相互作用。例如，增加一个区域的大小使得它能够在下游竞争中得到更好的位置。自然选择不关心脑加工过程如何怪异或是形成的脑如何丑陋。对修改的效果的评估，严格按脑算法指导动物的整体感知、思维和行动的效果。通过这些过程，自然选择能够构建一个功能更佳的大脑。

但随机变异的选择真的能改善神经系统的设计，还是会粉碎它，就像毁坏一个计算机程序中的字节一样，最后保留了没有被损坏的系统？计算机科学的一个新领域被称为遗传算法，它显示了达尔文主义的选择能够创造越来越智能的软件。遗传算法是复制出多个副本的程序，尽管有一些随机变异使得每个副本都略有一点儿差异。所有的复制品在解决问题时都有一场比赛，表现最好的才被允许为下一轮繁殖供给复制品。但首先，每个程序的各个部分都再次被随机变异，且成对的程序进行交配：每个都被一分为二，并相互交换半个。在经过许多轮的计算、选择、变异和繁殖后，幸存下来的程序往往比一个人类程序员所能设计的任何东西都要好。

与探讨心智演化更为相关的，是这个遗传算法在神经网络上的应用。我们可以将从模拟的感觉器官所得到的信息提供给一个网络作为输入，然后把网络的输出传递至模拟的肢体，再把这个网络放置在一个散布着“食物”及其他竞争网络的虚拟环境中。那些得到最多“食物”的网络在下一轮变异和选择之前留下了最多的复制品。变异就是联结权重的随机变化，有时伴随着网络之间的性别重新组合（交换一些它们的联结权重）。在早期迭代期间，“动物”——或者，就像有时它们被称为的，“有生命的物体”——在它们的领地内随意游荡着，它们偶尔会碰到一个“食物”。但随着进化，它们变为由一个“食物”呼啸而去。我们的确发现，当一整群神经网络是以演化的方式来调整它的内部的联结权重时，它们所表现出的效能通常都要高于单一网络自行进行学习所能够达到的效能。对于隐含多层级的网络尤其如此，这种网络是复杂动物，特别是人类一定具有的。如果一个网络只能学习，而不进化，那么环境的传授信号传播到隐含层时会被稀释得十分微弱，只能微弱影响联结权重。如果一群网络能够进化，即使它们不能学习，突变和交配的过程仍能直接地修改隐含层当中的联结权重值，该网络能够在一瞬间拥有与最佳状态更为接近的联结权重值组合。这也就是说，网络先天的结构是自然选择的结果。

进化和学习也可以同时发展，其天生结构在进化的动物也在学习。一群网络能够配置一个遗传学习算法，网络设计者通过猜测、沿袭传统或试错法构建的原始结构，被允许进化和修正。天生规格包括有多少个单位，它们是如何联结的，初始的联结权重是多少，以及在每个学习情境下权重应上下浮动多少等内容。模拟的演化过程将能够为网络在学习生涯中优先取得有利的地位。

因此，进化能够指导神经网络中的学习。令人奇怪的是，学习也能指导进化。还记得达尔文讨论的“有用结构的初始阶段”——那个半只眼睛有何好处的问题吧。神经网络理论家杰弗里·辛顿和斯蒂文·诺兰设定了一个残酷的例子。假设有一个被具有20个联结的神经网络控制的动物，每个联结要么是激活的（开）要么是中性的（关）。但除非20个联结都正确到位，否则神经网络无法发挥作用。不但有半个网络没用，就算有一个95%的网络也没用。在一个是以随机突变的方式来对神经网络的联结权重值进行设定的动物族群里，在大约每百万个（20 ²⁰ ）有着不同基因组成的个体当中，才会出现一个拥有完全正确联结的变种个体。更糟糕的是，如果这个动物是有性繁殖的话，这种优势立刻就消失了，因为在终于找到权重的神奇组合后，它交换了一半出去。在这个模拟情境中，没有任何适应性网络进化出来。

那么现在考虑一群动物，它们的联结可以有3种形式：天生开启，天生闭合，或者可以通过学习设置为开启或闭合。变异决定了动物在出生时某个联结具有这3个可能性中的哪一种（开启、闭合、可学习）。在这些模拟中，平均一只动物有一半的联结是可学习的，另一半是开启或关闭的。个体是以下述的方法进行学习的：每个动物在一生中尝试着随机确定可学习的联结，直到它遇到了神奇组合。在真实生活中，这或许是弄明白如何捕捉猎物或敲碎坚果的方法；不管是什么，动物感觉到它的好运气后就保持着这些设置，停止了试错。从那时起，它就享受了更高的繁殖率。动物在生命中越早获得正确的设置，它具有更高繁殖率的时间就越长。

既然有了这些进化的学习者，或者学习的进化者，具有不到100%正确的网络就有了优势。以所有具有10个天生联结的动物为例，大约1 000个中间的一个会10个联结都正确。（请记住100万个非学习的动物中只有一个具有20个天生联结都正确的动物。）这些禀赋良好的动物会通过学习其他10个联结而获得完全正确的网络；假如它只需要对1 000种不同的状况进行学习，那么它就能有相当大的机会找出正确的网络。得到答案的动物将能够更早进行繁衍，因此也能更频繁地进行繁殖。在它的子嗣中，变异的优势使得越来越多的联结天生正确，因为拥有越多开始就正确的联结，就会花越少的时间来试错，终其一生仍没有学到的概率就越小。因此，在辛顿和诺兰的模拟中，网络进化出越来越多的天生正确的联结。然而，联结从来没有变成完全天生的。随着越来越多的联结被修复好，修复剩余联结的选择压力逐渐减少，因为只需学习少量的联结使得每个生物体都肯定能够迅速学会。学习导致天生能力的进化，但又不是完全天生。

辛顿和诺兰将他们的计算机模拟仿真结果发到一家期刊，但他们被告知这消息在100年前就被先行登出了。心理学家詹姆斯·马克·鲍德温（James Mark Baldwin）曾提出，学习能够以这样的方式指导进化，创造出一种拉马克式进化幻象而无须真的有拉马克式进化。但没有人证明过这个被称为“鲍德温效应”的观点是否真的有效。辛顿和诺兰展示了为什么它能够有效。学习的能力将“从干草垛里寻找针”的进化问题调整为“当你接近了这根针时，会有人告诉你”。

“鲍德温效应”很可能在大脑的进化中发挥了主要作用。与标准社会科学模型相反，学习能力并不是人类在进化历史上晚近时期才达到的一个顶峰。除了最简单的动物之外，几乎所有的动物都能学习。这些就是像果蝇和海蛞蝓这样心智不复杂的生物成为神经科学家被试的原因了。如果多分子动物的早期祖先就有了学习能力，它可能就引导着神经系统向专业化回路进化，即使这些回路结构是如此复杂，以至于光靠自然选择不足以解释它们出现的原因。