那么,当你身处现实世界中,远离穆尼图和正弦波语音,你的预测性大脑会如何运作呢?假设你正在森林中露营,四周都是宁静、平和的自然景观。你已经在帐篷里窝了一整夜,第二天一大早,当你走出帐篷时,你的朋友们已经醒来并很快引起了你的注意。他们指着你脑袋上方说:“看看那边的树。”当你的眼睛看向朋友所指的方向时,你的大脑会采取哪些步骤呢?请记住,我们的大脑从来不是从零开始的——即使当你早晨第一次在一家新旅店或度假地醒来时,你的大脑也已经在忙碌地预测着什么了。随着你抬头仰望,新的感觉信息波抵达了。有反射光“撞”到了你的视网膜上,可能还有声音传入了你的耳朵,气味进入了你的鼻孔,以及各种触觉刺激你的皮肤。另外(我们将在后文详细探讨这一点),还有来自你的肠道、心脏和其他器官的内部信号。
简单起见,我们只考虑反射光,它刺激了你视网膜上的细胞,然后它们向大脑发送信号。当这些信号到达早期视觉处理区域时,它们会被你的大脑用来与当前预期的信号进行比较。也许你的大脑只期望一些相当普通的树木,尤其是你如果像我一样并非护林人。或者它在预测某种更具体的树。也许你知道自己在森林中某个特定的地方,你的大脑正在预测特定树的视觉信息。
不论以哪种方式,你都没有预测到你现在看到的正栖息在树梢上的知更鸟。你的大脑的最佳预测与感官证据相遇,会产生至关重要的残差。这些预测误差信号编码了你的大脑到目前为止还无法预测的感觉信息,向上(和横向)流动到大脑更深的区域,用于生成新的、改进的猜测。这些误差信号会作用于相应的结构,看有无已知信息可用于生成更成功的预测,能更好地匹配实际的感觉信号的预测。而后,大脑做出了更好的下行预测,包含更丰富的细节,比如周遭树木和树梢上那只知更鸟的外观。
知更鸟可能会让你大吃一惊——也许它们通常不在每年的这个时候出现。但是预测和预测误差的交换速度非常快,所以我们无法意识到表面之下所有正在进行的疯狂活动。对你而言,事情很简单:你看向朋友所指的地方,看到了那棵树,上面落了只知更鸟(这有点儿令人惊讶)。你当然不会先看到一个粗略的树轮廓,再看到一个更细致的树轮廓,这次包括一只鸟。一切发生得太快,但在某种意义上,这正是大脑内部真实的运作过程。
图1—5有效阐释了这一过程。其中,上方图片描绘了大脑如何处理信息的传统视角。左侧部分代表我们的视网膜接收的原始感觉数据,右侧覆盖在上层的卡通图案则代表我们从这些数据中提取有关外界信息的过程。但根据下方图片(预测处理视角),我们并不是从原始数据出发,而是从一个预测开始的,在这个例子中,是一棵相当普通的树。当传入的感觉数据与这个预测进行比较时,很快就会发现这里有一些意外情况,远远超出了对普通树的预测所能解释的范围。预测误差信号就产生了,启动了一段反复的过程,使被修正的预测与感官证据相匹配。经过一连串此类交换后,大脑最终形成对场景的稳定解释,这个解释现在包括了意想不到的知更鸟,并且(尽管图中未予展示)补充了关于树的更多细节。
请注意,千万别以为我们能体验到我所说的“感官证据”或“原始感觉信号”。相反,我们只有在感官证据(如撞到视网膜上的反射光的模式)与越来越准确的对该证据的预测相匹配时,才能“体验到”一些东西,而我们的预测是从过往经验和学习中提炼出来的。最初的预测就像粗略体验的草稿:我们辛苦获得的关于世界的基本知识通常让我们能做出很好的初步尝试,但体验是通过对这些草稿(基于由此产生的预测误差)的迅速改写来构建的。换言之,体验反映了随着未被预测到的感觉信息(预测误差)在系统中流动,我们调整最初的预测的方式。这些预测误差标记出意外信息,并要求进行新的、更好的预测。图1—6描绘了这一流程。更为详细的相关阐述可以参阅附录。
图1—5 如传统视角(上方图片)所示,感觉信息被收集后沿着信息链传递,在此过程中与记忆相匹配,并激活更抽象的理解。如预测处理视角(下方图片)所示,你从一个主动模型(大脑对可能存在之事的最佳猜测)开始,然后使用由此产生的预测误差(这里由表征知更鸟的意外视觉信息引起)来完善和修正这种猜测 [25]
图1—6 预测处理视角下对大脑中信息流动的高度图化。感觉输入是在来自大脑深处的预测(基于先验知识和过往经验)的背景下进行处理的。预测误差标记出感觉信号中未被预测到的部分。这些误差会前馈流动,触发经过修正的预测
从虚幻的手机振动到对鸟鸣声和《白色圣诞节》的幻听,再到在林中看到一只真实的知更鸟,我们的体验深受大脑持续预测的影响。大脑是预测机器,我们体验外部世界甚至自身的方式反映了这一简单却具有变革性的事实。 [26] 这改变了我们对心智、感官证据、身体感受、医学症状乃至与现实本身的关系的看法。
[1] 关于幻觉的早期报告,可见:Ellison, D. G., “Hallucinations Produced by Sensory Conditioning,” Journal of Experimental Psychology 28 (1941): 1–20。通过将“看到灯泡微微亮起”与“听到简单的音调”配对并反复向受试者呈现,实验者诱导了受试者随后的幻觉体验:接受“训练”后,听到同样音调的受试者会报告自己看见了很微弱的光。
[2] 马尔的具体观点详见其代表作: Vision: A Computational Investigation into the Human Representation and Processing of Visual Information (Cambridge: MIT Press, 1982)。
[3] 类似研究,参见:Riesenhuber, M., and Poggio, T., “Models of Object Recognition,” Nature Neuroscience 3 (Suppl) (2000): 1199–1204。早期一种重要的前馈观,参见:Hubel, D. H.,and Wiesel, T. N., “Receptive Fields and Functional Architecture in Two Nonstriate Visual Areas (18 and 19) of the Cat,” Journal of Neurophysiology 28 (1965): 229–289。最早揭示前馈观不足之处的一些结论性的实证检验,参见:Egner, T., Monti, J. M., and Summerfield, C., “Expectation and Surprise Determine Neural Population Responses in the Ventral Visual Stream,” Journal of Neuroscience 30(49) (2010): 16601–16608。还可参见:Petro, L., Vizioli,L., and Muckli, L., “Contributions of Cortical Feedback to Sensory Processing in Primary Visual Cortex,” Frontiers in Psychology 5 (2014): 1223。
[4] 例如,在光进入眼睛后,信号首先传递到外侧膝状体核(LGN),后者将信息传递到被称为V1的区域,但这种信息的前馈只是故事的一小部分。LGN的大部分(可能80%左右)输入其实来自大脑的其他区域,其中大部分自V1向下反馈。有关这些连接的估计,参见:Budd,J. M. L., “Extrastriate Feedback to Primary Visual Cortex in Primates: A Quantitative Analysis of Connectivity,” Proceedings of the Royal Society B: Biological Sciences 265(1998): 1037–1044。另请参见:Raichle, M. E., and Mintun, M. A., “Brain Work and Brain Imaging,” Annual Review of Neuroscience 29 (2006): 449–476。
[5] 一些关于行动的预测处理模型的精彩探讨和有力实验演示,参见:Muckli, L., et al., “Contex tual Feedback to Superficial Layers of V1 Report,” Current Biology 25 (2015): 2690–2695。
[6] 能耗数据引用自:Raichle, M., “The Brain’s Dark Energy,” Science 314 (2006): 1249–1250。
[7] 关于“我们几乎一无所知的奇怪架构”,参见:Winston, P., “The Next 50 Years: A Personal View,” Biologically Inspired Cognitive Architectures 1 (2012): 92–99。然而,即便在那时,我们也不像温斯顿所暗示的那样一无所知,因为关于下行布线的真正作用,人们在很久以前就已经有了一些不错的见解。相关实例参见以下注释中的参考资料。
[8] 在此期间有一篇相当重要的论文:Friston, K., “A Theory of Cortical Responses,” Philo sophical Transactions of the Royal Society of London B Biological Sciences 29, 360(1456)(2005): 815–836。更早的相关作品,包括:Mumford, D., “On the Computational Archi tecture of the Neocortex II: The Role of Cortico-Cortical Loop,” Biological Cybernetics 66(1992): 241–251;以及Lee, T. S., and Mumford, D., “Hierarchical Bayesian Inference in the Visual Cortex,” Journal of Optical Society of America A , 20(7) (2003): 1434–1448。另请参见:Hinton, G. E., et al., “The Wake-Sleep Algorithm for Unsupervised Neural Networks,” Science 268 (1995): 1158–1160。
[9] 需要注意的是,作为预测的根基,我们的许多知识都是终身学习的结果,但也有一些知识是演化的产物,它们已被自然选择预先安装为大脑的某些基本结构和连接模式了。参见:Teufel,C., and Fletcher, P. C., “Forms of Prediction in the Nervous System,” Nature Reviews Neuroscience 21(4) (2020): 231–242。此外,通过终身学习获得的一些知识可能会被压缩(通过一个被称为“平摊推理”的过程),形成快速、高效的连接,牺牲灵活性以换取速度。这些快速、冻结的连接可能(比如说)有助于我们快速领会特定场景的要旨,为主要的目标,也就是推动预测和预测误差信号更加复杂的相互作用铺平道路。有关平摊推理的更多信息,参见:Tschantz, A., et al., “Hybrid Predictive Coding: Inferring, Fast and Slow,” arXiv :2204:02169v2 (2022)。其在计划中的应用,参见:Fountas, Z., et al., “Deep Active Inference Agents Using Monte-Carlo Methods,” Advances in Neural Information Pro cessing Systems 33 (eds.) Larochelle, H., et al. (Red Hook, N.Y.: Curran Associates, 2020),pp. 11662–11675。
[10] 参见:Hermann von Helmholtz, Handbuch der physiologischen optic , in J. P. C. Southall(ed.), (English trans.), Vol. 3 (New York: Dover, 1860/1962)。
[11] 参见:Shannon, C., “A Mathematical Theory of Communication,” Bell System Technical Journal 27 (July, October, 1948): 379–423, 623–656。
[12] 无线电工程师协会的彼得·伊莱亚斯在两篇早期论文中提出了特别有先见之明的见解。这两篇发表于1955年的论文于1965年由曼弗雷德·施罗德和比什努·阿塔尔重新发现,他们同样在贝尔实验室工作。参见:Atal, B. S., “The History of Linear Prediction,” IEEE Signal Processing Magazine 161 (2006): 154–161。
[13] 参见:Musmann, H., “Predictive Image Coding,” in Image Transmission Techniques (Adv ances in Electronics and Electron Physics, Suppl 12), ed. W. K. Pratt (New York: Academ ic Press, 1979), 73–112。
[14] 参见:Friston, K., “The Free Energy Principle: A Rough Guide to the Brain?,” Trends in Cognitive Sciences 13(7) (July 2009): 293–301。关于这套策略与人脑神经回路间关联的一些更详细的研究,参见:Bastos, A. M., et al., “Canonical Microcircuits for Predictive Coding,” Neuron 76(4) (November 2012): 695–711。对神经证据的状态有一个相当平衡的观点,参见:Walsh, K. S., et al., “Evaluating the Neurophysiological Evidence for Predictive Processing as a Model of Perception,” Annals of the New York Academy of Scienc es 1464(1): 2020: 242–268。另见:De Lange, F., Heilbron, M., and Kok, P., “How Do Expec tations Shape Perception?,” Trends in Cognitive Sciences , 22(9) (June 2018): 764–779。
[15] 参见:Biderman, D., Shir, Y., and Mudrik, L. B., “Unconscious Top-Down Contextual Efects at the Categorical but Not the Lexical Level,” Psychological Science 31(6) (2020): 663–677。
[16] 网上一些素材对此有很直观的演示,相关视频参见:www.richardgregory.org/experiments/video/chaplin.htm。更多与“凹脸错觉”有关的讨论,参见:Gregory, R. L., “Knowledge in Perception and Illusion,” Philosophical Transactions of the Royal Society London, B 352(1997): 1121–1128。
[17] 穆尼图是以心理学家克雷格·穆尼的名字命名的,他在1957年手绘了许多这样的刺激物作为简单的工具来研究如何利用最少的信息产生有意义的视知觉。相关研究,参见:Mooney,C. M., “Age in the Development of Closure Ability in Children,” Canadian Journal of Psychology 11(4) (1957): 219–226。正文中的图片引用自Rubin, N., Nakayama, K., and Shapley, R., “The Role of Insight in Perceptual Learning: Evidence from Illusory Contour Perception,” Perceptual Learning , Fahle, M., and Poggio, T. (eds.) (Cambridge: MIT Press, 2002)。
[18] 对此我们可以多说两句。一旦你看过一幅穆尼图的原始图,而后再次看该穆尼图时,你就能利用更加丰富的知识库,该知识库将指导你如何对该图片进行视觉探索。至关重要的是,早期处理环节中检测与小狗有关的局部特征的神经元反应也会被锐化。尽管传入的感觉信息没有变化(仍是同一幅穆尼图),但更高层级的知识体系现在能很好地预测这些信息,早期特征检测器的响应方式也随之相应调整。更多关于如何预测解码穆尼图的信息,参见:Teufel, C.,Dakin, S. C., and Fletcher, P. C., “Prior Object-Knowledge Sharpens Properties of Early Visual Feature-Detectors,” Nature Scientific Reports 8, 10853 (2018)。
[19] 关于“正弦波语音”的原始论文,参见:Remez, R. E., et al., “Speech Perception Without Traditional Speech Cues,” Science 212 (1981): 947–950。如今人们对这一现象的见解和有关的音频实例,可见:马特·戴维斯的在线简介“An Introduction to Sine-Wave Speech”。
[20] 歌曲的选择反映了研究的最早起源,该研究可追溯至1964年,当时宾·克罗斯比仍然是世界上最著名的歌手之一。最初的论文是:Barber, T. X., and Calverey, D. S., “An Experimental Study of Hypnotic (Auditory and Visual) Hallucinations,” Journal of Abnormal and Social Psychology 68 (1964): 13–20。文中将这种现象描述为“催眠幻觉”。针对本科生的实验研究,参见:Merkelbach, H., and van de Ven, V., “Another White Christmas: Fantasy Proneness and Reports of ‘Hallucinatory Experiences’ in Undergraduate Controls,” Journal of Behavior Therapy and Experimental Psychiatry 32 (2001): 137–144。更大规模的后续实验,参见:van de Ven, V., and Merkelbach, H., “The Role of Schizotypy, Mental Imagery, and Fantasy Proneness in Hallucinatory Reports of Undergraduate Students,” Personality and Individual Diferences 35 (2003): 889–896。
[21] 压力和咖啡因摄入增强“白色圣诞节”幻觉的倾向,参见:Crowe, S. F., et al., “The Efect of Cafeine and Stress on Auditory Hallucinations in a Non-Clinical Sample,” Personality and Individual Diferences 50 (2011): 626–630。精神分裂症的影响,参见:Mintz, S.,and Alpert, M., “Imagery Vividness, Reality Testing and Schizophrenic Hallucinations,” Journal of Abnormal Psychology 79 (1972): 310–316,以及Young, H. F., et al., “The Role of Brief Instructions and Suggestibility in the Elicitation of Auditory and Visual Hallucina tions in Normal and Psychiatric Subjects,” Journal of Nervous and Mental Disease 175(1987): 41–48。
[22] 参见:Witzel, C., Racey, C., and O’Regan, J., “Perceived Colors of the Color-Switching Dress Depend on Implicit Assumptions About the Illumination,” Journal of Vision 16(12)(2016): 223。
[23] 关于晨型人与夜型人的研究,参见:Wallisch, P., “Illumination Assumptions Account for Individual Diferences in the Perceptual Interpretation of a Profoundly Ambiguous Stimulus in the Color Domain: ‘The Dress,’” Journal of Vision 17(4) (2017): 1–14。
[24] 在视觉领域,计算神经科学家拉杰什·拉奥和达纳·巴拉德在20世纪的最后几年创建的一个人工神经网络有力地证明了预测驱动学习的效力。他们用大量从自然场景图片中提取的样本(包括斑马、天鹅、猴子和森林的图片)训练该网络。样本图被输入一个简单的预测架构,其中各层级都致力于预测下一层级的当前活动。随着时间的推移,最初一无所知的网络开始习得自然场景图片中的模式,这证明预测的努力有助于习得成功的预测所需的知识。参见:Rao, R., and Ballard, D., “Predictive Coding in the Visual Cortex: A Functional Inter pretation of Some Extra-Classical Receptive-Field Effects,” Nature Neuroscience 2(1)(1999): 79。
[25] 这些论述源于柯蒂斯·凯利的一篇关于预测处理理论的通俗介绍。凯利在日本语言教学协会(JALT)的心智、大脑和教育特别兴趣小组工作。图片摘自预测处理的入门读物, Bwlletin of the JACT Mind, Brain, and Education SIG 6(10), (October 1, 2020)。
[26] 关于该主题的另外两本著作分别为:Jacob Hohwy, The Predictive Mind (New York:Oxford University Press, 2013),和我自己的作品 Surfing Uncertainty: Prediction, Action, and the Embodied Mind (New York: Oxford University Press, 2016)。Anil Seth, Being You: A Science of Consciousness (Penguin, UK, 2021)提供了认知神经科学的见解。Lisa Feldman-Barrett, How Emotions Are Made: The Secret Life of the Brain (New York:Houghton Miflin Harcourt, 2018),探讨了身体预测的强大作用。