在我们这个沉迷于互联网的时代,像互联网一样的脑这个概念可能看起来有些牵强或多余。但追溯到几十年前,在互联网时代之前,一些主流神经科学家已经在使用基于互联网的解释来阐述脑中的各种重大现象了。第一个将脑描绘成一个灵活的、类似于互联网的信息传递系统的说法,来自认知科学家波吉奥(Tomaso Poggio)。1984年,他在一份题为《路由思想》(Routing Thoughts)的技术报告中写道:“规划信息在不同信道中的传播路径……是神经系统日常需要解决的重大问题。” 尽管这份报告在现在看来相当晦涩难懂,但波吉奥在其中描述了一系列脑所需要面对的问题,而这些问题似乎需要用路由才能解释。 [1]
波吉奥所关注的是视觉脑。他尝试去解决一个长期存在的难题,即脑是如何产生视觉注意力的。很多事物都会把我们的注意力从当前所在之处吸引过去。比如,新的物体突然出现或移动,某人的面孔进入我们的视野。我们也需要有能力在一个场景中的众多物体中选择一个。通常我们通过移动眼睛来转移注意力,但我们也可以在不移动眼睛的情况下转移注意力。调整我们的视空间中的哪一部分应得到额外的关注,这是件再正常不过的事。我们根本无须移动头部的任何器官,当然也不用改变眼睛与脑的连接方式。
计算机隐喻该如何解释视觉注意力呢?如果用计算机类比的话,甲神经元的任务是接收一个信号,譬如说视网膜上的一个光点,对信号进行转换,并将转换后的信号传递给所有听命于甲神经元的神经元。在这种观点中,视觉注意力完全是由增强的神经活动构成,即一种计算。当我们关注某个特定的空间区域时,与之对应的一组神经元将变得更加活跃。换句话说,我们的目标是要找出神经元进行什么计算以实现信号的放大:它们用的是什么算法?但目前还不清楚与注意力相关的神经活动增强到底实现了什么。最重要的是,这些模型无法解释注意力是如何动态地转移并改变信息流的。 [2]
基于计算机隐喻所构建的注意力理论有其合理性,因为许多脑系统中的神经元确实是以相当可预测的方式进行信号转换的。在某些具体情况下,我们知道这种转换的目的。但计算方法在很大程度上是由程序上的必要性驱动的。在一个清醒的动物身上,一次从寥寥几个神经元上进行记录绝对是可行的——可我们无从得知我们所记录的那些神经元是如何连接的,或者信号是如何在众多神经元之间传递的。
但理论上这里还有一个被忽视的问题:神经元的经典模型中没有考虑对信号的选择性路径规划。具体来说,它们不允许神经元有时将信息传递给这些邻居,而在其他时候传递给其他邻居。这种事情一定会在脑中发生,就比如我们在巧克力口味或香草口味之间要做一个抉择,或是关注视空间中的一个部分而不是另一个部分时那样。能够实现这种灵活性的方法之一,就是让局部的神经元组充当信号的发送者、路由器和接收器,正如互联网上的情况那样。一个基于互联网隐喻的全新理论工具集,让我们设想脑中存在着像路由器那样的神经元,它们让脑的各个部位都能发送、传输和接收信号。尽管目前它们还相对默默无闻,但近些年神经科学家们已经发现了许多与此类似的潜在机制,我们将在第六章中对此进行讨论。
正如波吉奥最初意识到的那样,注意是一项需要能灵活地、有选择性地进行线路安排的任务。当我们注意某样东西时,我们其实是选定了视空间中的某个部分,并将其信号引导到脑中负责意识认知和强化视觉观察的那些部分;而在其他时候,则是视空间中的其他部分被送去进行这种额外分析。我们尚不清楚这个过程在脑中是如何实现的,但一个合乎逻辑的解释是,个别神经元或神经元集群充当了引导信息流的路由器。它也可能对需要注意的信号进行增强。但神经元网络上的有关信息——注意力焦点区域的颜色、形状和运动等——必须要能够被传递给“正确的”接受者,即脑中的眼动中枢、运动协调网络或记忆系统等。
神经科学中另一个长期存在的问题是视觉系统如何实现物体识别。几乎每个有视力的人,以及几乎所有的哺乳动物(事实上还有大多数脊椎动物和许多无脊椎动物)都具有将一团颜色识别为特定物体的能力。尤其是人类的视觉,似乎是围绕着物体识别而构建的。所有视力正常的人在识别一般物体方面都有着大致相同的能力。换句话说,形形色色的脑都拥有物体识别的能力,但其基本规则并不完全取决于某个特定的脑部结构。因此,脑的解决方案必须由一些通用的网络结构和动态规则来实现。
物体识别是一个棘手的问题。关于我们脑中物体识别的经典理论主要是基于视觉科学家马尔(David Marr)的工作。马尔是计算机隐喻的热情支持者,他认为视觉系统的神经机制就是一种支持感知软件的硬件。马尔并不认为脑是字面意义上的计算机。他的观点是,脑在进行着计算。1982年,他的里程碑式的专著《视觉》( Vision )出版(而他已于两年前35岁时英年早逝),他在该书中写道:
举例来说,想象一下用于预订机票的计算机所组成的国际网络。它执行着为世界各地数以百万计的乘客分配航班的任务。要了解这个系统,仅仅知道现代计算机如何工作是不够的。人们还多少得明白飞机是什么及它们有什么用;还得知道些地理、时区、票价、汇率和转接航班的相关内容,以及一些政治、饮食和恰好与这项特殊任务有关的人性的其他方面。因此,这里的关键点是,理解计算机与理解计算是不同的。 [3]
尽管马尔对计算有着精妙的看法,但他在物体识别概念中并没有给信息交流目标或网络架构留有任何空间。他的工作宗旨是推导出每一个细胞的计算目的。
一定程度上,马尔的观点可能是由他所处时代的神经生物学的伟大成就所塑造的。休伯尔(David Hubel)和维泽尔(Torsten Wiesel)因他们在这一领域的开创性研究而获得了诺贝尔奖。在20世纪五六十年代,休伯尔和维泽尔用麻醉后的猫进行研究,他们发现,当让猫的眼睛看着有特定方向、尺寸和位置的发光矩形时,某个视觉神经元就会产生稳定的电反应。休伯尔和维泽尔测量的每个细胞,都会对一个特定形状和位置的矩形产生最强烈的反应。在视觉系统的更大范围内,存在着能够对猫视野中各种方向、尺寸和位置的矩形都很敏感的细胞。还有一些神经元能够对矩形的运动及其他视觉范式产生反应。
休伯尔和维泽尔总结道,单个细胞的功能就像范式检测器,在那里守候着特定的光线图案——或许是一个向右倾斜45度的瘦长方形——穿过细胞正观察着的一小片视空间区域。从这一发现中,包括马尔在内的许多科学家都得出这样一个结论,即视觉系统的主要任务就是用这些由神经元组成的庞大而多样的视觉检测器来分析视空间的每一个部分。
马尔推断,通过使用神经算法和计算操作,就能从这些检测器的活动中提炼出物体识别和其他功能。只要从这世界中获得一个可判读的范式——例如由人们最爱的马克杯所反射的光的范式——这些系统就可以对数以千计甚至百万计的特征检测器中的相关神经元放电模式进行计算并识别物体。积累数十年的证据表明,这种系统确实是视觉系统实现物体识别的主要组成部分。
但这种经典的方法是不完整的。因为我们的视觉世界是千变万化的,视觉系统需要忽略杯子外观的大量变量因素,以便能可靠地把它检测出来。举例来说,无论杯子是在我们的右边还是左边,无论它是在近处还是远处,我们都要能够识别它。在每一种情况下,我们的眼睛接收到的图像可能会有很大出入,但我们所需的视觉系统输出——“我的马克杯”——必须是相同的。
一般来说,有两种方法能解决这个问题,也就是所谓的不变性问题(problem of invariance): [4]
(1)我们可以给整个视空间铺满检测器,让视网膜图像上处处都有准备就绪的马克杯检测器。每当视空间中某一部分的光线范式落到视网膜上并匹配足够多的检测器时,这块区域的马克杯检测器就被激活了,而我们就将其识别为一个马克杯。
(2)在我们的视空间中的任一地方寻找看起来大致像个杯子的东西,接着系统通过神经机制将这个原型杯子的位置转移到视空间的中心部分,然后用一套共用的马克杯检测器对其进行分析。
由于方案(1)将耗费大量的资源来建造可能很少会用到的马克杯专用检测器,因此它被认为是不太可行的;而与之相对的方案(2),则受到许多科学家的青睐。 [5] 但这种针对不变性问题的路由式解决方案需要引入一套非经典的机制,即主动控制神经信号。无论这个杯状物出现在视网膜的什么地方,其视觉数据都能与唯一的一套检测器组相匹配。
路由式解决方案绝不是被普遍接受的,在支持它的人中也很少有人意识到它最初是由波吉奥提出的(他用它来解释一个相关的现象)。但是请注意,我们正在把一个计算问题重塑为一个通信问题:这里的挑战不是在每一个地方计算出“马克杯”,而是在视网膜上找到近似马克杯的东西,并在适当的时间将与之相关的信号传递到适当的地方。互联网隐喻将脑视为一个通信系统,从这个角度来看,这些正是我们应该去考虑的模型类型。此外,我们也可以从互联网中寻找词汇来描述路由模式的各种挑战。我们还可以从它那里获得实现高效路由的基本策略。
物体识别至少在一定程度上是一个信息交流问题,这不仅仅是因为我们实现它除了需要视觉信号之外,还要结合听觉、触觉和嗅觉的信号。正如波吉奥最初指出的那样,注意力也是一个信息交流问题。我认为,学习和脑的其他核心功能也都是信息交流问题。这些功能挑战或许可以通过采用类似互联网的原则来尝试解决。
虽然有些人可能认为互联网隐喻是对计算机隐喻的悖离,但在回顾了波吉奥的想法之后,我们或许更应该将互联网隐喻视为一种由来已久的理论解读,并且如今已经是时候对其进行更充分的表达和接纳了。事实上,波吉奥甚至提出过这样的想法:脑中的信息路由的基础是数据包,也就是互联网上标准化的信息块。所有的通信和文件都被分割成数据包,其中包含关于它们来自哪里和要去哪里的信息。尽管波吉奥是在1984年撰写这些内容的,而当时互联网还处于刚刚起步阶段,但他认为它的概念和组件均具有高度的创新性,而他也从中获得了灵感。互联网很快就成了改变世界的重要力量。或许,它也将改变我们对脑的理解。
互联网隐喻将脑的互联性视作一种基本特征。基于这种连接性,脑的每个部分都有可能向几乎任意一个其他部分发送信息。这就需要有灵活的路由机制。用我的同事、比较神经学领域的著名研究者芬利(Barbara Finlay)的话来说,这相当于“把整个脑给整合在一块儿了”。
互联网最重要的架构特征之一,就是在网络中存在着将任意一个用户与任意一个其他用户连接在一起的短路径。从技术上讲,互联网就像是一个小世界网络(small-world network),用户之间只有几个路由器的距离。这种连接性与室内游戏“凯文·培根的六度空间”(six degrees of Kevin Bacon)所体现的原理相同。也就是说,“六度分割”可以将任何演员与凯文·培根联系起来,或者将地球上的任意一个人与任意另一个人联系起来。 [6] 因此,互联网上的信息交流网络也像是一个小世界网络。
脑也有类似的互连性(interconnectivity)。 [7] 连接组学现在已经揭示,脑任何部位的任意一个神经元与几乎任意一个其他神经元之间只有三四个突触的距离。小世界网络不是通过将每个部分连接到其他每个部分或让每个部分连接到一个中央交换机来实现的。相反,小世界网络有着很高的本地连接性,但同时还有少量但重要的“捷径”。在社交网络中,捷径指的是那些为数不多的朋友遍天下的人。而互联网和脑中的捷径,主要指的是那些在相距较远的分离集群之间传递信息的少量长距离线缆。脑中的大多数连接——就像大多数的朋友关系——都是短距离的,跨度可能只是一个本地群落。只有少量特定个体会与远处集群中的对应个体进行交流,发送或接收信号,并在本地集群内共享。
除了要实现几乎所有部分之间的交流外,大自然还有什么理由把脑设计成在网络上任意两个节点之间拥有如此短的路径的模式呢?随着脊椎动物的脑体积不断增大,建造长线程捷径的成本就越来越高,而捷径是哺乳动物脑的普遍性和决定性的特征。 [8] 脑的任何一个部分与其他任意部分都如此邻近,那要如何才能防止一个区域的活动溢出到另一个区域呢?我相信,这个答案就是脑中有一个统一的路由协议——在许多方面类似于互联网协议——来协调信号的传输。
我们将互联网的路由协议设计为具有高度的灵活性。同样,灵活性对于脑来说也是非常有益的。例如,脑和神经系统的损伤都能够通过灵活性来解决,更多时候它被称为可塑性(plasticity)。可塑性本意是形状的改变,但事实上,当脑受损时,脑网络主要是利用现有的连接进行信号流的重定向,而不是去改变形状(在这个语境中就是去建立新的连接)。
以猴为对象进行的一项实验说明了这一点。在猴脑中,有一个特定区块的神经元负责分析触觉。猴的每根手指都对应着一个特定区块的神经元,它们监听来自这根手指所发出的信号。如果一根手指的信号被阻断,例如通过使用麻醉剂,动物就不能再感受到该手指的触觉了。但以前接收这些触觉信号的脑区块仍然是可用的。事实上,它会接手分析邻近手指信号的工作。有了原本分配给相邻手指的神经元,再加上那些信号受阻手指不再占用的神经元,这种合并的脑算力会让邻近手指的触觉变得甚至比往常更加敏锐。值得注意的是,这种神经交流范式的变化,在来自受损手指的信号消失后的一小时内就会发生。 [9] 鉴于一小时的时间太短,脑还来不及新建多少神经线路,所以脑网络必然有能力灵活地适应损伤,并在不重新布线或改变形状的情况下切换信息流。
在高级认知功能方面,人类也是高度灵活的——甚至或许是独一无二的。用认知科学家利伯曼(Philip Lieberman)的话来说,我们可是“不可预测的物种”。 [10] 我们需要不断面对全新的挑战,包括内部和外部的。一个灵活可控的“心智工作空间”是我们人类每天都要使用的东西。特别是学习,它本质上就是一个灵活的过程。我们的高层心智必须能够在产生诸如习惯、规范和推理的一系列系统中共享信息。所以我们必须要有一个灵活度与之类似的物理上的脑网络来支持这些能力。
脑网络所需要承担的功能需求必然是复杂的。但是,对于如何建立一个能有效应付这类需求的系统,我们也有一个现成的方法,那就是互联网。我们知道信息是如何在互联网上传递的,因为它就是我们设计的。而且它很管用!互联网变得越来越可靠,就像电网一样,甚至在某些地方比电网更可靠。尽管互联网还存在一些缺陷,但它还是行之有效,因为它在基本架构上有着灵活的设计。
是什么特性让互联网的路由协议在灵活性方面如此出色呢?我们不妨从设计的角度来思考这个问题。假设我们要从零开始设计一个通信系统。我们需要考虑的因素或许包括它有多少个节点和链接,以及它们是如何连接的。但我们也需要考虑用户如何发送消息的现实情况。这些链接每天或每分钟有多少次活动的机会?对于邮政服务来说,通常是每个地址每天一次,就在邮件被取走或送达的时候。对于互联网来说,那就是几毫秒或更短的时间一次。我们还需要问:在给定的时间内,我们可以发送多大或多密集的信息?老式的电话很适合双向对话——特别是细节丰富或带有情感的信息——因为它非常适合捕捉细微的听觉线索,例如说话者的叹息或音调的变化。电话擅长实时传递密集型的信息。用简练的话来说,电话适用于同步式双向通信。
但是,如果我们只是想让另一个人知道我们这个星期五要去的音乐会是在晚上7点钟开场,那就没有必要占用对方的电话线路了,一封简短的电子邮件或一则短信可能更好——收信人完全可以在自己方便的时候再阅读它。也就是说,此时我们希望使用一个异步系统。我们可能还会想使用一个适合于在时间上稀疏分布的简短信息的专用系统:这个系统的信息通道中会有短暂的活动,随后则是长时间的静默。正如我们将要看到的,在很大程度上,脑也是一个异步式通信系统,而且这个系统的活动是不频繁的。
这种低频的异步式通信协议可以让能耗维持在较低水平。这对脑来说是很重要的。脑中无数神经元的能量消耗是巨大的,所以脑必须要控制开支。由于脑的能量限额是如此捉襟见肘,以至于那种关于人脑只利用了十分之一的流行说法在某种意义上来说也没错:因为我们在一定时间内只能允许有大约10%的神经元进行放电。大多数时候这个比例可能更低。也并非总是同一批10%的神经元在活动(但有些神经元很少甚至从不活动)。 [11] 尽管神经元放电活动已经如此稀少,尽管它们只占体重的2%,但脑要完成这些任务仍然需要消耗大约20%由身体新陈代谢产生的能量(在婴儿期和儿童早期时这个数值还要翻一番)。 [12] 这种对能量用度的严格限制在所有体型的脊椎动物脑中都基本相同,因此它也应该是对路由协议的一个基本约束。 [13] 正如我们将看到的,互联网在能量使用方面也非常高效,这在一定程度上也是因为它的活动是低频的。
设计通信网络的另一个考量是如何处理错误。所有的通信系统都会出错:链接可能被破坏,太多的信息同时到达,交换机会发生故障,信号会丢失或损坏。所有主流通信系统都将纠正这些错误的手段作为它们的一个关键设计特征。对于传统的电话来说,最常见的错误就是在试图联系已经在进行另一个通话的对象时,呼叫者会收到一个忙音信号。至少在呼叫等待和语音信箱之前,忙音信号一直是电话通信中无处不在的特征,因为通信协议的设计排除了在同一时间进行两个对话的可能性。 忙音信号通知来电者,被叫方的线路正在使用中,来电者应稍后再试。在电话和面对面的语言沟通中,一旦建立了同步性,错误也就可以得到纠正了。如果我没听清你说了什么,我可以请你重复一遍。错误是日常发生的,也是预期之中的事,而且可以用简单的解决办法迅速纠正。
相比之下,在互联网上,如何在一开始就避免错误则是关键。我们不能让一条关于音乐会的信息的某一部分被送达(例如“星期五”),而其他部分却没有送达(例如“晚上7点”)。问题是,这种错误没办法像在传统电话中那样被接收者立即注意到并被发送者马上纠正,因为发送者和接收者是异步的。然而,由于收件人不知道我们是什么时候按下“发送”按钮的,所以网络中继机构就有一段时间来修复任何错误。网络上的路由器会先确保信息的每一部分都出现在我们的收件箱,然后再通知我们信息的存在。
互联网有一个聪明的方法来完成这个任务。这个方法用到了路由器之间的自动信息。一个批次信号的接收方会向发送方转发一条信息,简单来说就是“我收到了”。这些返回的信息被称为“ack”,是英文“acknowledgment”的简称。 这些ack与信息在相同的网络上遵循相同的规则传递,但它们也可能经由不同的路线返回到发送方。如果发送方的路由器没有及时收到ack,它将重新发送缺少的那部分信息。与电话场景中的纠错机制不同的是,电话采用的是同步通信形式,而互联网的确认反馈系统则是异步的。在脑中也有着与此惊人相似的机制。
互联网通信的指向性也是一个关键的设计要素,同时它也与脑有着密切的关联。我所说的“指向性”是指信号在特定的信道中只能向一个方向流动。早在20世纪初现代神经科学诞生之时,神经元提供定向通信的概念就已经形成了。基于对神经元的解剖学研究,西班牙科学家卡哈尔(Santiago Ramón y Cajal)总结道,在一个典型的神经元中信息只会向一个方向流动。 [14] 正如后来的工作所阐述的那样,神经元的单向性从根本上塑造了脑的设计。但是,我们也必须考虑主要由单向神经元组成的大规模网络架构的性质。我们可以通过观察脑中的丘脑(thalamus)区域,来看到脑使用的那种网络架构的例子。
在哺乳动物中,总是可以看到像芬利所说的那种“核心脑区”,也就是连接着脑大部分区域的脑区。 [15] 丘脑正是这些核心脑区之一。它是“脑即互联网”中主干网络的一部分。丘脑在三个方面占有核心地位。首先,它处于颅内中心位置(图1.1)。其次,它在功能性方面处于中枢地位。丘脑是视觉不可或缺的门户:脑中唯有丘脑这一个区域可接收来自眼睛的视信号,视觉在此基础上才能形成。在除嗅觉之外的所有其他感觉中,丘脑都扮演着类似看门人的角色。不仅是感知觉,丘脑还与其他系统有关。它参与运动协调,并且与姿势调控之类的功能有关。简而言之,丘脑就是功能的中枢。最后,在连接性方面,丘脑拥有能够将信号投送到大量脑区的神经连接。在这些脑区中也有许多都有着反向投射回丘脑的神经连接。事实上,这种反馈系统完全主导了丘脑的数据流。
图1.1 信息从眼传至丘脑再到皮层,然后回到丘脑(并再继续回到皮层)。到达丘脑主要视觉区的传入神经大约有5%来自眼,其他的均来自皮层,包括初级视皮层(V1)和无数其他皮层区域,以及脑的其他部位。环形连接是脑视觉通路中网络结构的主要来源,它们能够支持像互联网那样的灵活网络通信机制。图片由格雷厄姆提供
视觉信息流入丘脑的过程有点像在一台小电视上观看一场棒球比赛,而同时有一屋子的人在一起向我们喊出他们对比赛的看法。在丘脑与视觉相关的区域中,所有来自眼的神经元连接只占该区域输入的5%左右;而其余的输入则来自脑的其他地方。具体而言,丘脑中与视觉有关的部分接收了大约200万个轴突的传入(每只眼约100万个),但该区域同时接收到来自脑其他部位多达4000万个轴突传入——它们来自大脑皮层、脑干及其他脑区。来自眼的有限输入对视觉意识的重要性很难低估:我们所看到的一切都只是由我们脑中约0.002%的神经元传递到丘脑,而来自脑其他部位的反馈信息却在数量上大大超过了这些视信号。 [16]
这种网络结构可能看起来很奇怪,但如果我们从类似互联网的通信角度考虑就能理解它的意义。它使来自眼睛的信号能够很容易到达大脑皮层中许多可能的目标区域。丘脑中的每个部分都有轴突可以到达大脑皮层的不同区域。但从大脑皮层回到丘脑的反馈回路使信息能够触及更多可能的目标。信号可以离开丘脑,进入大脑皮层,在大脑皮层中经过一两个突触的传递,回到丘脑的不同部分,然后再传递到大脑皮层的其他地方。
这整个过程是非常快的。神经回路能够让信息在短短9毫秒的时间内从丘脑传到大脑皮层并返回(一个眨眼动作则需要100多毫秒)。 [17] 很有可能这些回路就是一个返回信息ack系统的基础,就像互联网上那样。重要的是,正确的信息能够到达正确的地方,而且是以可靠的方式。长期以来,如经过丘脑的神经回路这样的结构一直困扰着研究人员,他们对此提出了诸多假设性解释。但还没有人真正考虑过通信目标或是类似的确认系统。
传统的看法认为,丘脑的工作是为通往大脑皮层的信号“调节权重”,增加一些信号强度,减少其他信号强度,从而实现例如视觉注意力之类的功能。这种解释完全符合计算机隐喻,即神经元的任务是根据输入信号的一些数学函数计算来输出活动。然而,调节权重这种说法不能解释为什么一定需要回路结构。为什么不是在丘脑中有一个局部回路来学习最佳权重,从而直接对来自眼的信号进行操作呢?为什么要大费周章地铺设代价高昂的大量轴突,将信号送至大脑皮层再返回呢?不使用经过大脑皮层的神经回路来学习最佳权重,可以省下神经线路的成本,还能节约宝贵的几毫秒的传输时间。这样一来构建也会没那么复杂。
从另一个角度,按照互联网隐喻的逻辑,回路和小世界网络则是必需的,因为它们能实现通往许多目的地的短路径,并具有用ack系统来进行纠错的可能性。这就是互联网隐喻如何帮助我们解释现有研究结果并通过全新方式来理解脑网络的一个例子。
随机性在计算机和互联网中扮演的角色是完全不同的。这些差异也可以帮助我们理解脑的互联网隐喻背后的逻辑。随机变化,即噪声,是计算机的大忌。从最先进的量子计算机到最简单的数字计算器,噪声是完全无法被接受的。如果能容忍它的存在,那么计算就可以在相同的输入下产生截然不同的结果。噪声会让计算机变得毫无用处。但是互联网,就像事实所证明的那样,是需要有随机性的。
这是互联网历史中的一个早期发现。20世纪70年代,夏威夷建立了一个名为“阿罗哈网”(ALOHANET)的类似互联网的无线电网络,在该网络中我们可以发现随机性的用途。在信息传递过程中注入随机变化解决了一个关键问题:如何处理信号在网络上发生碰撞的情况。当这种情况发生时,网络将需要重新发送这两个信号。但是,如果它们再次碰撞呢?毕竟,它们都想在同一时间到达同一个地方。阿罗哈网的工程师意识到,如果我们为两个信号引入一个微小的随机延迟,那么我们几乎可以确保它们不会再次撞到一起。
注入随机性这一基本解决方案对于互联网的正常运作仍然至关重要。反过来,这一洞见可能也有助于我们理解脑中的“噪声”。没有人确切知道到底什么是脑中有意义的信号,以及什么算是无意义的噪声。但是,如果我们把噪声看成是一个潜在特征而不是一个异常故障,那么我们可能会更好地理解什么才是真正的信号。这只需要转变一下我们的类比框架,以及我们对脑这个复杂系统应该如何运作的假设。
除了强调随机性的好处之外,互联网隐喻还有助于我们发现脑中互操作性(interoperability)的重要性。在互联网上,许多应用程序可以在同一组连接上运行,它们的相关信号在网络上传输时也可能混杂在一起。这一事实让我们想到了互联网的另一个一般性策略:信息在大多数情况下是被同等对待的。它们是基于一套通用的全局规则,在本地信息流中进行路由的。在任何时刻,进入我们Wi-Fi路由器的数据流都将是各种消息类型的混合:电子邮件的一部分可能在视频的一部分之后到达,紧随其后的可能是先前发送的电子邮件的一个ack。
这种系统通过设立一种名为“协议栈”(protocol stack)的东西来处理信息洪流可能带来的问题。协议栈会对各种信息块进行整理,并将它们送到正确的应用程序,例如电子邮件或网页。协议栈是分层级的:基础的电信号位于最底层,它们将被整理成数字化字符,接着是数据包,然后是数据流,最终就是完整的消息或文件。在信息的源头上,某个意图——譬如说写一封电子邮件——会随着它在协议栈中的逐层下降而衍生出越来越复杂和精细的数据表征。然后这些数据将被送入路由器网络。一旦数据包到达了目的地,信号就在接收器的协议栈中逐层上升。此时发生的就是一个逆向过程,将分散的信号重组成越来越有组织的数据表征。
脑也是一个分层级的通信系统,其信息是许多层次的相互作用的总和。在探讨神经信息的传递时,神经科学家贝尔(Tony Bell)使用了“涌现”一词来描述“合多为一”的行为,而用“淹没”一词则描述“化一为多”的行为。 [18] 这个想法能够很好地映射到协议栈隐喻上。从受体生物化学层面的活动涌现突触层面的树突动态,在此基础上又涌现细胞层面的电学特性变化,继而再涌现出一个从细胞体到轴突的信号,最终产生一个“放电”。贝尔所谓的“淹没”,则是一个与上面相反的进程。当一个电信号接近轴突末端的突触时,会逐渐产生越来越复杂和精细的变化动态。涌现和淹没可以扩展应用于所有的神经集合和全脑的各种活动过程。这些过程不断相互作用,共同催生出脑活动,并最终产生各种行为。因此,这些系统的动态就类似于互联网的协议栈动态:每个信号都与一些更大的通信信号集(即“信息”)有着复杂但又机械的关系。
和本书引言中提到的那位穿越时空的工程师一样,除非我们能了解系统的路由协议,否则我们很难认知到互联网上的某个数据包是有意义的。脑中的网络活动也反映了在很大程度上构筑信息流的必要。随着对脑路由协议的约束条件有了更深的认识,我们就有可能理解什么是脑中的“信息”,以及某个信息到底有什么功能。
此外,我们知道,神经元利用通用的神经结构体系来交换不同类型的信息。当我们在探讨脑如何决策时,我注意到有一些神经元的任务似乎就是对证据进行权衡。一旦收集到足够的证据——例如以过去的一些选择为参考——这些细胞就会基于对该证据的计算结果而做出行为决策。但证据的本质是什么呢?它可能是实时发生的视觉或听觉信号,但它也可能是记忆、情感联想或是其他类型的信号。
脑必须是多模式运作且是可互操作的。来自不同子系统的信息需要能够根据一套通用规则进行相互作用,而且速度要快。负责不同功能的脑区之间的网络距离非常短,这也印证了对互操作性的需求。因此,统一协议栈就是全脑通信的一个完全可信的概念性模型——或许这就是它的机制模式。
一旦我们开始认识到神经元和神经元集群的主要工作是在不同的时间与不同的目标进行交流,并且不是与其近邻的神经元进行交流,重要的特征就开始浮现,有时它们甚至出乎我们意料。路由的一个关键功能就与寻径有关,即找出利用通信网络中的链接的最佳方式。在互联网上,路由器从其他路由器自动发布的列表中学习通往目的地的简短路径。这些列表被称为路由表,它们会根据对网络的通断探测而定期更新。尽管在互联网的小世界网络中可能有许多条路径都运作良好,但打算去往同一目的地的数据包通常会被路由分配到同一路径上。然而,如果一条路径出现故障节点或变得非常繁忙,发送路由器也可以很轻易地找到一条与这条路径差不多好的其他路径。这种路径的冗余实际上是开发分布式计算机网络的动机之一,其初衷就是在中央指挥节点被摧毁时也能稳定地传达信息和投送指令。
当网络找到一条好路径时,它就学到了一些东西:它了解到网络及世界的当前状态。脑中的学习也可以用类似的方式来考虑。
神经层面上的经典学习模型借用了赫布型学习(Hebbian learning),即认为一起活动的神经元会建立更强的联系的观点。 [19] 这一机制认为,我们学习一项任务就是通过某种方式将相应范式编码到我们的神经元中。它完全是基于计算机隐喻的。通过反复放电来提高神经元之间的突触强度从而将学习实例化,这就是我们今天所说的赫布型学习的基础。这个概念是由科诺尔斯基(Jerzy Konorski)在1948年提出的。科诺尔斯基提出这个想法,是基于他对已知神经元特性的推断,而不是直接观察。后来,赫布(Donald Hebb)对其进行了详细阐述,这个概念也因此而得名。 [20] 赫布型学习的思想就是“一起放电的神经元是连接在一起的”。这一关于学习的机制假说影响了之后数十年的神经科学研究。
毫无疑问,在同一时间活跃的神经元往往会建立更强的联系,尤其是在神经发育阶段。但单凭其本身,赫布型学习并不足以解释脑中的知识和学习行为的大多数特性。越来越多的人开始对赫布型学习作为成年动物记忆的基础持怀疑态度。 [21]
相反,感觉经验或语义知识可以通过在许多相关神经元之间找到有效路径的方式来学习——例如,在额叶决策脑区、联想区和感觉区之间——并根据需要来增强沿着这些路径的信息流量。学到了新东西,就建立了一个新的稳定路径。这种学习模式可能需要某些神经元能够在超过一次跳转的路径上引导信息。目前,它还不是一个被广泛接受的想法。但脑结构和脑的功能需求则强有力地表明了多跳转通信的可能性,而且它还必须是灵活的。
正如我所强调的,我们的认知能力的各项特性中最突出的可能就是灵活性了。我们基本上可以在任何时间选择我们想要相互交流的脑区,以及应该给予哪些连接更多的流量。 [22] 我们还可以相当轻松地切换任务。任务切换是复杂脑的一个标志性行为,也是人类特别擅长的行为。但任务切换却是计算机——尤其是人工智能——不太擅长的事情。互联网却有能力将这类问题高效解决,包括将网络流量重新路由到新路径上的能力,以及携带类型多样和内容各异的信息的能力。
即使脑没有在积极思考或学习,它仍然可能需要对任何节点和任何其他节点之间的路径有时新(up to date)的了解。互联网通过在节点之间发布路由表来实现这一目标。这个过程可能对应于默认模式网络(default mode network),它似乎维护和支撑着脑的“后台”功能。 通过互联网隐喻的视角来看,这种活动可以确保脑的任何部分都有可能通达。正如我们将在第六章中看到的,脑中神经振荡的同步性可能就是在需要时调用路径的机制。与下游神经元同步的信号发送神经元群,可以影响那些下游神经元。在错误时间到达目标的信号就会被忽略。 [23]
计算机隐喻所忽略的脑的最后一个特征是,脑会成长和进化。在日常生活中,我们永远不会说让我们的笔记本电脑或手机成长,好让它做一些新的事情——我们说的是升级,这意味着用另一个部件取代某个部件。与此相反,我们常常会说让我们的网络成长和发展,无论是物质空间意义上的社交网络还是基于计算机媒介的网络,以使它们更加强大。脑网络在发育过程和达尔文进化过程中也会扩展规模。在这个过程中,它们将获得新的功能和力量。
扩张的主要挑战是,如何在不损害现有网络通信的方式的前提下向系统内追加新的神经元和突触,并为拓展后的网络增加新的通信可能性。在发育过程中,网络的扩张和变化大多是由遗传程序引导的,但它也有很多非计划性增长和变化的余地。例如,脑对新的外部条件的反应,是缓慢地改变其网络结构。在个体的时间尺度上是如此,在进化的时间尺度上也是如此。因此,拥有一个相对普遍适用于脑网络上的交流方的共同协议,就可以有效促进和协调随时随地发生的扩展了。
互联网是为非计划性增长而设计的:任何人都可以加入,只要他们符合直接的、公开的互联标准。这种非计划增长的能力使得互联网的增长速度超过了人类历史上的任何其他通信系统。而且它还在继续增长,一部分也是因为新型冠状病毒加速了它的发展,它让许多物质空间中的活动转移到了网络世界。今天,互联网主机的数量比许多灵长类动物大脑皮层中的神经元数量(数十亿)还要多。随着核心互联网和物联网的扩展,节点网络的规模可能会接近我们自己的大脑皮层(超过200亿个神经元),也许有一天会接近我们整个脑的大小(860亿个神经元)。因此,互联网在长期和短期范围内支持网络扩展的方式,或许可以为脑如何解决发育和进化中的类似挑战提供一些线索。
脑网络的扩展甚至可以为我们提供一种方法来经验性地评估脑的路由策略。不同的路由策略——例如传统电话与互联网——的规模扩张方式也不同。因此,如果我们把脑当作一个黑盒路由系统,并以正确的方式进行探测,我们或许就能验证脑使用的是类似互联网的路由协议,而不是其他类型的协议。我们将在第六章中详细研究这个提案。
脑在无数方面与互联网不同:脑不是严格意义上数字化的,它没有同步时钟,而是在慢得多的时间尺度上运行,它的传输成本很高,等等。今天,即使是各色教科书和协议规范中提到的“互联网”,在某些方面也与同名的真实计算机网络系统有所差异。以路由器形式存在的超高速计算机,使得互联网路由协议中一些用来确保稳健性(robustness) 的特性几乎成为多余。
但互联网的基本设计选择仍然至关重要,它们为脑提供了最有用的可比之处。没有小世界网络结构就没有互联网,没有分包的、可互操作的信息就没有互联网,没有灵活路由的可能性就没有互联网,没有ack就没有互联网,没有信息传递中的异步假设就没有互联网,没有关于如何将信息送到目的地的信息共享就没有互联网。我相信脑同样使用类似互联网的策略来解决类似的问题,尽管它肯定会将这些策略与许多其他的策略进行权衡,包括计算上的限制。
归根结底,脑可能采用的是一种与互联网在很大程度上不同的路由协议。甚至可能不同的脑会采用若干非常不同的路由协议,尽管我假设在所有的哺乳动物中都有一个独特、统一而又灵活的协议。重点是,脑必然有某种路由协议,神经科学应该尝试找出它是什么;而互联网隐喻则可以在这项工作中给我们提供帮助。
不同的脑可以执行基本相同的功能(图1.2),因此脑也可以被视为是定量科学的研究对象。这意味着必然存在着一套通用的规则,所有类似的脑都要遵循这些规则来实现它们众多的功能,而无须考虑每个脑的精细细节。这套规则中的某一些横亘了许多进化谱系。我认为,人脑的能力至少部分归功于支持灵活的全脑通信的网络结构和活动原则。我甚至认为,互联网隐喻为研究这些共通原则提供了一个可用的框架,并提供了一般性类比和具体的工程解决方案,它可以促进我们对我们脑中所发生的事情的理解。
图1.2 图中显示的是30个成年人脑的矢状面结构性磁共振成像。请注意,不同的脑在形状和结构上有很大差异。但尽管有这些差异,所有的人都是健康的个体,他们在意识体验、感觉和知觉、情绪、记忆,以及其他一系列功能方面有着高度相似的能力。图片由格雷厄姆和波梅兰茨(Lauren Pomerantz)使用openfmri.org的公共数据制作
[1] 另一个与脑科学有关的计算机网络隐喻的早期案例是由韦格纳(Daniel Wegner)在1995年提出的,他使用一张计算机网络的图片来表示社交互动中信息的分享。Daniel M. Wegner,“A Computer Network Model of Human Transactive Memory,” Social Cognition 13, no. 3(September 1995):319–339.
[2] John H. Reynolds and David J. Heeger,“The Normalization Model of Attention,” Neuron 61, no. 2(January 2009):168–185.
[3] David Marr, Vision: A Computational Investigation into the Human Representation and Processing of Visual Information (Cambridge, MA: MIT Press, 1982),5.
[4] 与这个问题有关的综述可参见Laurenz Wiskott,“How Does Our Visual System Achieve Shift and Size Invariance?”in 23 Problems in Systems Neuroscience, ed. J. Leo van Hemmen and Terrence J. Sejnowski (New York: Oxford University Press, 2005),322–340。
[5] B. A. Olshausen, C. H. Anderson, and D. C. Van Essen,“A Neurobiological Model of Visual Attention and Invariant Pattern Recognition Based on Dynamic Routing of Information,” Journal of Neuroscience 13, no. 11(1993):4700–4719.也可参见P.Wolfrum,“Switchyards -Routing Structures in the Brain,”in Information Routing, Correspondence Finding, and Object Recognition in the Brain (Berlin: Springer, 2010),69–89。
[6] 在脸书上,用户一般彼此之间距离是四度(共同好友)。Lars Backstrom et al.,“Four Degrees of Separation,”in Proceedings of the Fourth Annual ACM Web Science Conference (New York: Association for Computing Machinery, 2012),33–42.
[7] 可参见Olaf Sporns, Discovering the Human Connectome (Cambridge, MA: MIT Press, 2012)。
[8] Georg F. Striedter, Principles of Brain Evolution (Sunderland, MA: Sinauer Associates, 2005),126–131.
[9] Thomas Weiss et al.,“Rapid Functional Plasticity of the Somatosensory Cortex After Finger Amputation,” Experimental Brain Research 134, no. 2(2000):199–203.
[10] Philip Lieberman, The Unpredictable Species: What Makes Humans Unique (New York: Princeton University Press, 2013),2.
[11] Saak V. Ovsepian,“The Dark Matter of the Brain,” Brain Structure and Function 224, no. 3(2019):973–983.
[12] Michel A. Hofman,“Energy Metabolism, Brain Size and Longevity in Mammals,” Quarterly Review of Biology 58, no. 4(1983):495–512.
[13] Suzana Herculano-Houzel,“Scaling of Brain Metabolism with a Fixed Energy Budget per Neuron: Implications for Neuronal Activity, Plasticity and Evolution,” PLoS One 6, no. 3(2011).
[14] S. R. Cajal, Leyes de la Morfología y Dinamismo de las Células Nerviosas (Madrid, Spain: Imprenta y Librería de Nicolás Moya, 1897).
[15] Barbara L. Finlay,“Principles of Network Architecture Emerging from Comparisons of the Cerebral Cortex in Large and Small Brains,” PLoS Biology 14, no. 9(2016):e1002556.
[16] 尽管丘脑接收到的来自视网膜视觉系统的输入只占了5%,但这些神经纤维对丘脑神经元的驱动程度是超过源自皮层的输入纤维的。不过,从视网膜到丘脑的有效输入估计也就不超过总输入的10%。 Masoud Ghodrati, Seyed-Mahdi KhalighRazavi, and Sidney R. Lehky,“Towards Building a More Complex View of the Lateral Geniculate Nucleus: Recent Advances in Understanding Its Role,” Progress in Neurobiology 156(2017):214–255.
[17] Farran Briggs and W. Martin Usrey,“A Fast, Reciprocal Pathway Between the Lateral Geniculate Nucleus and Visual Cortex in the Macaque Monkey,” Journal of Neuroscience 27, no. 20(2007):5431–5436.
[18] Anthony J. Bell,“Levels and Loops: The Future of Artificial Intelligence and Neuroscience,” Philosophical Transactions of the Royal Society of London , Series B: Biological Sciences 354, no. 1392(1999):2013–2020.
[19] Donald Hebb, The Organization of Behavior: a Neuropsychological Theory (New York: Wiley, 1949, repr. Lawrence Erlbaum Associates, 2002).
[20] Jerzy Konorski, Conditioned Reflexes and Neuron Organization (Cambridge: Cambridge University Press, 1948),89; Hebb, The Organization of Behavior.
[21] 关于当前对赫布式学习的看法,详见Patrick C. Trettenbrein,“The Demise of the Synapse as the Locus of Memory: A Looming Paradigm Shift?” Frontiers in Systems Neuroscience 10(2016):88。
[22] 可参见Alexander Schlegel, Prescott Alexander, and Peter U. Tse,“Information Processing in the Mental Workspace Is Fundamentally Distributed,” Journal of Cognitive Neuroscience 28, no. 2(2016):295–307。
[23] Pascal Fries,“A Mechanism for Cognitive Dynamics: Neuronal Communication Through Neuronal Coherence,” Trends in Cognitive Sciences 9, no. 10(2005):474–480.