目前来看,感知的大脑的核心工作原理与智能相机观点基本相反。大脑并非不断耗费大量能量来处理传入的感觉信号,其主要工作其实是学习和维系一种关于身体和世界的模型,这种模型无时无刻不被用于尝试预测感觉信号。这些预测有助于构建我们看到、听到、触及和感受到的一切。当我早上听到并不存在的鸟鸣声时,它们正在工作。当我感受到不在我口袋里的手机振动幻觉时,它们也在工作。但我们将会发现,当我听到真实的鸟鸣声,感受到真实的手机振动,以及看到散落在我大学办公室桌面上的各式物品时,它们也在发挥作用。
预测性大脑是对我们周围世界的一种不断运行的模拟——或者至少是对我们很重要的部分世界的模拟。传入的感觉信息被用于保持模型的真实性——比较预测与感官证据,并在两者不匹配时生成误差信号。尽管这种连接方式带来了高昂的成本,但我们很快将看到不断的预测提高了效能。或许更重要的是,它还使我们能够灵活地以反映当前任务和环境要求的方式调整我们的反应。与从一连串感官线索中稳定提取丰富的世界图像不同,丰富且不断演变的世界图像只是起点,而感觉信息被用于测试、探测和微调该图像。在接收新的感觉信号之前,预测性大脑已经在忙着描绘事物最可能呈现的样子了。
这大体上解释了所有下行连接的必要性。它们承载着来自大脑深处的预测,将预测推向感官外围。这也解释了仅用于维持大脑内在活动的巨大能耗,这些活动是为了维持即时预测的模型而必不可少的。当大脑接收新的感觉信息时,其任务就是确定该传入信号中是否有任何内容看起来像是重要的“新异信息”,即对我们尝试看到或做的任何事情都很重要,却又未被预测的感觉信息。越来越多的学者已开始相信,这正是我们的大脑处理感觉信息的主要方式。为了检验这一假设,过去10到15年间,计算神经科学和认知神经科学领域涌现了大量研究,现有理论已经能详细且可验证地解释这一过程,让我们得以理解温斯顿所说的“奇怪架构”了。 [8] 这些理论有各种称谓,包括“预测处理”“分层预测编码”“主动推理”。我将主要使用“预测处理”这个便捷的标签来概括它们。
根据这种观点,感知的智能相机模型其实大谬不然。尽管它直观上很有吸引力,但对感知的正确解释(在大多数情况下)不应是一个主要从眼睛和其他感官向内运行的过程,大脑也永远不只是在那里耐心等待感觉信息的到来。 [9] 相反,它积极地预测感觉信息,运用它对世界中的图案和物体的所有了解——鸟儿的叽喳声(以及我爱人设定的晨起闹铃)、太过频繁的手机振动干扰以及我办公桌上各式物品的摆放。它还不断利用活动的身体,转动头部、眼球和肢体来获得新的、更好的信息。这样的大脑不是感觉信息的被动接收者和处理者,而是一个不知疲倦的预测者(而且我们稍后将看到,它还是一个熟练且主动的询问者),它基于自身的感觉信号流进行预测。