大脑和人工智能的未来畅想（全11册）最新章节_杰夫·霍金斯著

第3章
大脑中的世界模型

大脑的作用对你来说可能是显而易见的。大脑通过感官获得信息输入，接着将这些输入进行处理，最后采取行动。动物如何对它所感受到的事物做出反应决定了大脑工作的成效。从感觉输入到采取行动的这种直接映射，只适用于大脑的某些区域。例如，手臂意外地触碰到一个烫的物体，便会迅速反射性缩回，负责这个输入-输出的回路位于脊髓中。但新皮质呢？我们能说新皮质的任务是接受来自感官的输入，然后立即采取行动吗？简单来说，不能。

读这本书时，除了翻动书页或触摸屏幕外，它并没有引起任何直接的行动。成千上万的文字流入你的新皮质中，在大多数情况下，你并没有受这些文字信息的影响而立即采取行动。也许将来你会因为读了这本书而有不同的行为，例如，某天你会与别人谈论关于大脑的理论或人类的未来，如果没有读这本书，你就不会有这种对话；也许你未来的某些想法和话语中的某些用词会受到我写的这些文字的微妙影响；也许你会基于大脑原理创造智能机器，而我的话会激发你朝这个方向前进……但现在，你只是在阅读。如果我们坚持把新皮质描述为一个输入-输出系统，那么最好的解释是，新皮质获得大量的输入，它从这些信息中学习，然后，在以后的某个时间点，也许是几小时后，也许是几年后，它会根据这些先前的输入采取不同的行动。

从我对大脑的工作方式感兴趣的那一刻起，我就意识到，把新皮质设想成一个由输入引向输出的系统也是徒劳无益的。幸好，当我在加州大学伯克利分校读博士研究生时，我产生了一个新想法，这驱使我走上了一条与众不同但也更成功的道路。当时我在家里工作，桌子上和房间里有几十个物体。我意识到，如果这些物体中的任何一个发生了变化，哪怕是最轻微的变化，我都会注意到它。我的铅笔筒总是放在桌子的右侧，如果有一天我发现它放在了左侧，我就会注意到这种变化，并想知道它为什么会出现在那里；如果订书机的长度改变了，只要我摸了订书机或看过它，我就会注意到这种变化。我甚至会注意到订书机在使用时是否发出了不同的响声；如果墙上的时钟改变了位置或样式，我会注意到；如果我把鼠标移到右边时，计算机屏幕上的光标却向左移动，我也会立即意识到有问题。令我吃惊的是，即使我没有特意关注这些物体，我也会注意到这些变化。当我环顾整个房间时，我没有问“我的订书机长度是否正确”，也没有想到“检查一下，时钟的时针是否比分针短”。违反常态的变化会突然出现在我的大脑里，然后我的注意力就会被吸引过去。在我所处的环境中，有成千上万种可能的变化，我的大脑几乎立刻就能注意到这些变化。

我能想到的只有一种解释：我的大脑，特别是大脑新皮质，正在对它将要看到、听到和感觉到的东西同时做出多种预测。每次我移动眼睛，大脑新皮质就对它将要看到的东西进行预测。每次我拿起东西，大脑新皮质就会预测每个手指应该有什么感觉。我做出的每一个动作都会使大脑新皮质预测我将听到什么。我的大脑预测了最小的刺激物，如咖啡杯把手的质地，以及宏大的概念性想法，如日历上应该显示的正确月份。这些预测发生在每一种感觉模态（sensory modality）中，包括低层次的感觉特征和高层次的概念，这说明新皮质的每一部分，也就是每根皮质柱，都在进行预测。预测是新皮质十分普遍的功能。

当时，很少有神经科学家将大脑描述为一个预测机器。将研究重点放在新皮质如何同时进行许多预测，将是研究它如何工作的一种新方法。我知道新皮质并不是只做预测这件事，但预测代表了一种破解皮质柱之谜的系统性方法。我可以提出具体问题，以了解神经元在不同条件下如何进行预测。这些问题的答案可能会揭示皮质柱的功能是什么，以及它是如何实现这一功能的。

为了进行预测，大脑必须学习什么是准确的，也就是说，基于过去的经验，应该做出什么样的预测。我之前写的一本书《新机器智能》就探讨了关于这种学习和预测的想法。在那本书中，我使用了“记忆-预测模型”这一短语来描述整个想法，我还论述了以这种方式来思考大脑的意义。我认为，通过研究新皮质如何进行预测，我们将能够揭示出新皮质的工作原理。

如今，我不再使用“记忆-预测模型”这一短语。取而代之的是，我会用“新皮质学习了一个世界模型，并基于该模型进行预测”来表达同一想法。我更喜欢用“模型”这个词，因为它更准确地描述了新皮质学习的那种信息。例如，我的大脑有一个关于订书机的模型，这个模型包括订书机的外观、触感以及在使用时发出的声音。大脑关于这个世界的模型包括物体的位置，以及当我们与这些物体互动时它们发生的变化。例如，我脑海里关于订书机的模型包括订书机的顶部相对于底部如何移动，以及当顶部被压下时，订书钉是如何出来的。这些动作可能看起来很简单，但你并不是生来就具有这些知识。你在生命中的某个时刻学会了这些知识，然后储存在了你的新皮质中。

大脑创建了一个预测模型，但这只是意味着大脑会不断预测输入的信息会是什么。预测并不是大脑时刻会做的事情，而是大脑的一种内在属性。大脑永远不会停止预测，预测在大脑的学习中起着至关重要的作用。当大脑的预测得到验证时，就意味着大脑中的世界模型是准确的。一个错误的预测会使你注意到这个错误并更新该模型。

这些预测中的绝大部分，我们都不会意识到，除非与输入到大脑的信息不匹配。当我随意伸手去拿咖啡杯时，我不会意识到大脑正在预测拿起杯子时每个手指会有什么感觉，杯子会有多重，杯子的温度是多少，以及当我把它放回桌子上时杯子会发出怎样的声音。但如果杯子突然变重了，或者变冷了，或者发出吱吱声，我就会注意到这些变化。我们可以确定这些预测正在发生，因为任何输入的信息即使发生微小的变化，都会被注意到。但是，当一个预测是正确的，就像大多数预测一样，我们就不会意识到它曾经发生过。

你出生时，你的大脑新皮质几乎一无所知。它不知道任何一个单词，不知道建筑物长什么样子，不知道如何使用计算机，也不知道什么是门，以及门是如何通过铰链移动的。它必须学习无数的知识。新皮质的整体结构并不是随机的，它的大小、区域数量以及这些区域是如何连接在一起的，在很大程度上都是由我们的基因决定的。例如，基因决定了新皮质的哪些部分与眼睛相连，哪些部分与耳朵相连，以及不同部分之间如何相互连接。因此，我们可以说，新皮质与生俱来的结构就是为了实现看、听甚至学习语言等功能而设计的。但是，新皮质并不知道它将看到什么、听到什么，以及它可能会学习哪种语言。我们可以认为，新皮质在你刚出生时就已对世界有一些固有的假设，但对于具体事物一无所知。通过经验积累，它学习了一个丰富而复杂的世界模型。

新皮质所学习的东西数量巨大。例如，我现在坐在一间有着数百个物体的屋子里，我随机挑选一个，如一台打印机。我的大脑已经学习了一个打印机的模型，包括它有一个纸盘，以及纸盘如何进出打印机。我知道如何改变纸张的大小，以及如何拆开一沓新纸将其放入纸盘。我知道清除卡纸所需的操作步骤。我知道电源线的一端有一个D型插头，这个插头只能从一个方向插入。我知道打印机打印时发出的声音，以及当它单面打印和双面打印时，声音有何不同。我的房间里还有另外一个东西，一个小小的、有两个抽屉的文件柜。我可以回忆起关于这个柜子的几十件事情，包括每个抽屉里有什么，以及抽屉里的东西是如何排列的。我知道抽屉有一把锁，也知道钥匙在哪里，以及如何插入和转动钥匙来锁住抽屉。我知道这把钥匙和锁摸起来的感觉，以及使用它们时发出的声音。钥匙上有一个小环，我知道如何用我的指甲撬开这个小环，把一把钥匙放进去或取出来。

想象一下，你正在家中挨个房间走动。在每个房间里，你可以想起数以百计的物品，对于每件物品，你可以遵循一连串已掌握的知识。你也可以对你居住的城市做同样的练习，回忆在不同地点有哪些建筑、公园、自行车架和树木。对于每件物品，你可以回忆与之相关的经历以及你是如何与之互动的。你所知道的东西的数量是巨大的，而与之相关联的知识似乎也是永无止境的。

我们的大脑也会学习许多高层次的概念。据估计，我们每个人大约知道4万个单词。我们有能力学习口头语言、书面语言、手语、数学语言和音乐语言。我们的大脑会学习电子表格的工作原理、恒温器的作用，甚至“同理心”或“民主”这些概念的含义，尽管我们对这些事物的理解可能有所不同。暂且不管新皮质还能做什么其他事情，我们至少可以肯定地说，它学习了一个令人难以置信的复杂的世界模型。这个模型是我们进行预测、感知和行动的基础。

通过运动学习世界的预测模型

输入大脑的信息是不断变化的。原因有两个：第一，世界在不断变化。例如，在听音乐时，来自耳朵的信息输入在迅速变化，这表明音乐正在播放。同样，一棵在微风中摇摆的树会导致人的视觉和听觉的变化。在这两个例子中，大脑的信息输入在不断变化，不是因为你在移动，而是因为世界上的事物在运动和变化。

第二，我们在移动。每当我们迈出一步，移动一下肢体，转动一下眼睛，摆一下头，或发出一个声音，感觉输入就会发生变化。例如，我们的眼睛大约每秒钟快速移动3次，这种现象叫作扫视。每一次扫视，眼睛都会将目光转移到周围一个新的点上，从眼睛输入到大脑的信息会完全改变。如果我们没有移动眼睛，这种变化就不会发生。

大脑通过观察其信息输入如何随时间变化来学习世界模型。没有其他的学习方式。与计算机不同，我们不能将文件上传到大脑。大脑学习所有东西的唯一途径是通过其输入的变化。如果输入大脑的信息是静止的，大脑就什么也学不到。

有些东西，如旋律，不需要移动身体就能学会。我们可以闭着眼睛静静地坐着，只听声音如何随着时间的推移而变化，就能学会一个新的旋律。但大多数学习需要我们积极地移动身体，进行探索。想象一下，你进入一个你以前没有进过的新房子里。如果你不移动，你的感觉输入就不会有任何变化，你就不可能学到任何关于这个房子的东西。为了学习房子的模型，你必须向不同的方向看，从一个房间走到另一个房间。你需要打开门，偷看抽屉里的东西，并将它们拿起来。房子和房子里的东西大多是静态的，它们不会自己移动。要学习一个房子的模型，你就必须移动。

以一个简单的物体为例，如鼠标。要了解鼠标摸起来的感觉，你必须用手指去触摸它。要了解鼠标的外观，你必须从不同的角度观察它，把你的视线聚焦在不同的位置上。要了解鼠标的作用，你必须按下它的按钮，滑开电池盖，或在鼠标垫上移动它，看一看、摸一摸、听一听会发生什么。

这个过程对应的术语是感觉-运动学习。换句话说，大脑通过观察我们的感觉输入如何随着运动而变化来学习世界模型。我们不需要移动就可以学习一首歌，因为这与我们从一个房间移到另一个房间的顺序不同，一首歌中的音符顺序是固定的。但世界上大多数场景并不是这样的。大多数时候，我们必须通过移动来发现物体、地点和动作的结构。在感觉-运动学习中，与旋律不同，感觉的顺序并不固定。当我进入一个房间时，我看到了什么，取决于我把头转向哪个方向。当我拿着咖啡杯时，我的手指有什么感觉，取决于我的手指是向上、向下还是向侧面移动。

做每一个动作时，新皮质都会预测做出这个动作之后的感觉会是什么。如果我沿着咖啡杯向上移动我的手指，我预测会触摸到杯口，向旁边移动我的手指，我预测会触摸到杯柄。如果我在进入厨房时把头转向左边，我就预测会看到冰箱，如果把头转向右边，我就预测会看到储藏室。如果我把眼睛移到左边的煤气灶前，就预测会看到我需要修理的坏掉的打火器。如果有任何信息输入与新皮质的预测不一致（也许是我妻子修理了打火器），那么我的注意力就会被吸引到预测错误的地方。这就提醒了新皮质，它需要更新这部分世界模型。

关于新皮质如何工作的问题，我现在可以给出更精确的表述了：由数千个几乎相同的皮质柱组成的新皮质，是如何通过运动学习世界的预测模型的？

这就是我和我的团队着手回答的问题。我们相信，如果我们能回答这个问题，就能对新皮质进行逆向工程。我们将了解新皮质的功能以及它是如何实现这一功能的。最终，我们将能够制造出以同样方式工作的智能机器。

神经元工作的两个基本原则

你还需要了解一些基本的概念，然后我们才能开始回答上述问题。像身体的其他各部分一样，大脑也是由细胞组成的。大脑中的细胞叫作神经元，在许多方面与所有其他细胞相似。例如，神经元有一个定义其边界的细胞膜和一个含有DNA的细胞核。然而，神经元又有几个独特的属性，这些属性在身体的其他细胞中并不存在。

第一，神经元看起来像一棵树。它的细胞膜有树枝状的延伸，名为轴突和树突。树突是输入端，聚集在细胞附近；轴突是输出端，它与附近的神经元建立许多连接，但往往要延伸很远，如从大脑的一侧延伸到另一侧，或从新皮质一直延伸到脊髓。

第二，神经元产生脉冲，脉冲也叫动作电位。动作电位是一种电信号，从细胞体附近开始产生，沿轴突行进，一直到达轴突末端。

第三，一个神经元的轴突会与其他神经元的树突建立连接。这些连接点被称为突触。当沿轴突行进的脉冲到达突触时，便会释放一种化学物质，这种化学物质会进入接收神经元的树突。释放的化学物质类型决定了接收神经元产生脉冲的频率。

根据神经元的工作原理，我将陈述两个基本原则。这两个原则对我们理解大脑和智能至关重要。

原则一：思想、观念和感知都是神经元的活动

无论什么时候，新皮质中都会有一些神经元积极地发射脉冲信号，而另一些则不会。通常情况下，在同一时间活跃的神经元数量很少，可能只占全部神经元数量的2%。你的想法和感知是由活跃的神经元决定的。

例如，当医生进行脑部手术时，有时需要将清醒的病人大脑中的一些神经元激活，于是他们将一根小小的探针插入新皮质，用电来激活一些神经元。这时，病人可能会听到、看到或想到些什么。当医生停止刺激时，病人的这些体验就会停止。医生激活不同的神经元，病人便会产生不同的想法或感知。

人的思想和体验正是一组神经元同时活跃的结果。单个神经元可以参与许多不同的思想或体验。你的每个想法都是神经元的活动。你看到、听到或感觉到的一切也是神经元的活动。我们的精神状态和神经元的活动是一体的。

原则二：我们所知道的一切都储存在神经元之间的连接中

大脑记住了很多东西。你有永久性记忆，如你在哪里长大；你也有临时性记忆，如你昨晚吃了什么；你还有基本的知识，如怎样打开一扇门或如何拼写“字典”这个词。所有这些东西都是通过突触，即神经元之间的连接来存储的。

以下是关于大脑如何学习的一些基本概念。每个神经元都有数以千计的突触，这些突触将神经元与成千上万个其他神经元相连。如果两个神经元同时发射脉冲信号，便会强化它们之间的连接。当我们学习时，这些连接就会强化，而当我们忘记一些事情时，这些连接就会减弱。这一基本思想是由加拿大心理学家唐纳德·赫布（Donald Hebb）在20世纪40年代提出的，今天人们称其为“赫布理论”（Hebbian learning）。

许多年来，人们认为成人大脑中神经元之间的连接是固定的，学习只是增强或减少突触的强度。这仍然是目前大多数人工神经网络中的学习方式。

然而，在过去的几十年里，科学家发现，在大脑的许多部分（包括新皮质）中，新突触会形成，旧突触会消失。每天，单个神经元上的许多突触会消失，新突触会取而代之。因此，大部分的学习是通过在以前没有连接的神经元之间形成新的连接而发生的。当旧的或未使用的连接被完全移除时，就会发生遗忘。

大脑中的连接存储着我们通过经验学习的世界模型。每天我们都会经历新的事物，并通过形成新的突触来为模型添加新的知识片段。在某个时间点活跃的神经元代表我们当前的想法和感知。

我们现在已经讨论了新皮质的几个基本组成部分，即拼图的一些碎片。在第4章中，我们将把这些碎片拼在一起，揭示整个新皮质的工作原理。

第3章 大脑中的世界模型

通过运动学习世界的预测模型

神经元工作的两个基本原则

原则一：思想、观念和感知都是神经元的活动

原则二：我们所知道的一切都储存在神经元之间的连接中

第3章
大脑中的世界模型