利昂·库珀教授与我同在纽约,他是诺贝尔奖获得者、“库珀对”(Cooper pair)概念的提出者之一。那时,这位物理学天才站在我所在班级的最前方,身着得体的意大利西装,一头卷发修剪得无比精致(图2-1)。在他的高等量子力学课上,学生们一脸敬畏地看着他随手在黑板上画出费曼图。
图2-1 库珀教授在布朗大学
注:左一为库珀教授。图片由美国物理学会埃米利奥·塞格雷视觉档案、W. F.麦格斯诺贝尔奖获得者纪念展友情提供。
量子力学在特定的最小亚原子尺度上描述宇宙(图2-2),在这个尺度上,构成宇宙的“物质”同时具有粒子和波的特征。能量和物质同时具有粒子性与波动性。你明白了吗?没有?没关系,大多数物理学家也不明白。这是一个抽象的、反直觉的理论,那些描述它的方程盘根错节,极为复杂。1948年,理查德·费曼(Richard Feynman)找到了一种更好地理解量子力学的方法,后来他因在量子电动力学方面的贡献获得了诺贝尔奖。他提出了简单又直观的费曼图,完全改变了物理学家处理复杂粒子相互作用的方法。费曼还因他广泛的兴趣,追求真正的生活之乐,以及简化概念并清楚明白地传达给学生的教育理念而闻名。他可以让物理系的年轻学生理解最艰深的理论,而费曼图表明,他也可以让那些成名已久的物理学家理解这些理论。
图2-2 宇宙中的大尺度结构
注:图中的每个点都对应着一个星系,而图中共有约10亿个星系。图片由加州理工学院的杰米·博克(Jamie Bock)提供。
库珀站在黑板前,面露迷人的微笑,寥寥几笔就画出了一幅图。那些直线、曲线和螺旋线,那些向前或是向后的箭头,那些诸如电子、正电子和夸克的大量粒子符号迅速地出现在黑板上又很快消失。最终,费曼图(图2-3)出现了,它描述了电子及其反粒子湮灭过程中的量子动力学。我似乎看到能量与物质如粉笔一般洁白,而黑板就犹如浩瀚的宇宙,能量和物质匆匆地出现又迅速消失,从一种形式变成另一种形式。库珀是一位物理学大师,跟随他学习物理学,就像一个篮球爱好者有幸能与迈克尔·乔丹(Michael Jordan)打一场球一样。
图2-3 费曼图
注:一个电子(e - )与一个正电子(e + )彼此湮灭,并产生光子(γ)。
1957年,27岁的库珀与约翰·巴丁(John Bardeen)、罗伯特·施里弗(Robert Schrieffer)一道,成功破解了一个存在了40年的谜题,解释了一种被称为“超导”现象的量子力学机制,并因此获得了诺贝尔奖。
库珀的诺贝尔奖故事始于1911年。当时,荷兰的实验物理学家海克·卡末林·昂内斯(Heike Kamerlingh Onnes)发现,当把金属的温度降低到接近绝对零度(-273.15℃,理想状态的可能最低温度,在这个温度下系统的能量为0)时,电子会无阻力地“流过”金属。这一发现震惊了科学界。在一般情况下,电路中的电流是电子相对于导体固有电阻的流动,它与摩擦力使路面上的车轮减速的原理类似。因此,对电子流不具备阻力的材料被称为超导材料。这就像路面情况发生了突变,车轮可以在绝对光滑且无摩擦力的表面上完全无阻力地滚动一样。从此,超导材料被应用于诸多技术领域,其中很多都是基于电流与确定电流产生的磁场之间的密切关系。
在20世纪初期量子力学出现之后,很多伟大的物理学家(包括爱因斯坦)都试图找到超导性在微观层面的理论基础,然而都失败了。超导性的量子力学图像并不存在。库珀凭借着自己与生俱来的对物理学的敏锐洞察力,提出了“库珀对”的概念,揭开了超导性的量子力学秘密。在一般情况下,单一电子在金属导线中流动时之所以会遇到阻力,是因为它们之间彼此排斥,就像橄榄球或足球比赛中防守球员干扰带球者的运动一样。然而,库珀指出,通过利用电子的波动性,它们可以“结对”,这就改变了它们在金属中彼此排斥的性质,并可以让它们无阻力地传导。
量子化后的超导性意味着只存在离散能量,而没有连续的能量流,所以离散能量同样很重要。当库珀、巴丁和施里弗发现了超导性的原理之后,其他人就可以将其应用于众多领域了。超导性是核磁共振技术(MRI)的核心理论,在医学影像上,核磁共振技术常被用来探究解剖形态和功能。在某些情况下(比如肿瘤探测),X射线扫描还不够精确,而更精确的方式需要均匀的强磁场。超导体中的强电流可以产生强磁场,而强磁场正是核磁共振扫描所需的。此外,超导量子干涉装置(SQUID)可用于探测极端微弱的磁场,例如在生物学领域,它被用于测量大脑中的神经活动,或是微小的生理变化所产生的其他弱磁场,比如胎儿的心脏。
磁悬浮列车是基于迈斯纳效应(Meissner effect),而后者是超导体的直接结果。磁场与电流之间的相互作用意味着磁场会对电子产生作用力,从而阻碍电流的流动。超导体不会对电子流产生阻碍,它会排斥外部磁场,以保持电流的无阻碍流动。因此,如果你把一块磁铁放在超导材料上方,材料中的超导电流会拒绝磁场进入其内部,这就会产生强烈的镜像磁场,让磁铁飘浮在半空中。磁悬浮列车的轨道完全由超导体铺就,以磁铁为原材料的火车“轮”会产生迈斯纳效应,让列车飘浮起来。这种效应在希格斯玻色子的发现过程中发挥了关键作用。实际上,希格斯玻色子就是超导性的表现形式之一,只不过超导介质是空无一物的空间本身。这些成就紧随库珀及其侪辈做出的突破性发现,但这只是库珀成为我心目中的英雄的部分原因。
在高中学习快结束时,我已经阅读了维尔纳·海森堡(Werner Heisenberg)关于矩阵力学的著作。海森堡是量子力学的奠基人之一,他因提出了量子力学中的基本原理——不确定性原理而为大家所知。我也读过史蒂芬·霍金(Stephen Hawking)的《时间简史》( A Brief History of Time ),霍金是一位宇宙学家,以研究黑洞发出的辐射而闻名。我还通读了《别逗了,费曼先生》( Surely You're Joking, Mr. Feynman! ),这本书节选自费曼多姿多彩的生活。阅读一切我所能找到的有关物理学的书籍,让我在布朗克斯的成长生涯里,从多数人眼中“无比黯淡”的未来之中挣脱了出来。
怀着成为一位物理学家的梦想,我进入了大学。在面对物理学专业的严苛要求时,我却觉得自己完全没有准备好。我经常盯着某一页书达数小时之久,反复阅读某一段话或是一组方程,直到那些概念慢慢地渗入我的脑海。为了应付冗长的考试和实验报告,我几乎把咖啡当成了主食。在本科阶段和研究生阶段早期的大部分时间里,我都觉得自己是一个来自布朗克斯的十分愚笨的特立尼达人,梳着一头发辫,与周围格格不入。
在努力成为一个物理学研究人员的过程中,我甘愿忍受多年的自我怀疑和同僚的看低。在本科阶段,我学会了巧妙地使用各种方程来描述我周边的世界。那些物理概念虽然非常有趣,但难于理解,因而令人沮丧。我常常在心里问自己:“为什么宇宙中会存在大尺度结构,而非空空荡荡、一片鸿蒙?”这完全是我的好奇心作祟,但这个问题令我寝食难安,就像小时候弹奏钢琴时,我的注意力会离开乐谱上的音符,转而去思考音乐存在的意义,以及为什么它会让我产生我所体会到的感受。后来,通过研究量子理论,我慢慢找到了探究这个物理学基本问题的关键。
非常幸运的是,在我读了两年硕士研究生之后,那位神奇的量子大师库珀破格接收我作为博士研究生进入他的科研小组——库珀组。我非常震惊,我的梦想就这样实现了。随着我对库珀的了解的不断加深,我发现他是一位既不受任何分支学科限制,也无法用任何分支学科来定义的理论物理学家。在追求自己理想的过程中,他和费曼一样,不受条条框框的约束,敢于怀疑一切。他满怀热情地与其他学科的教师一起授课,仿佛这种合作以及思想之间的交流已经铭刻在了他的血液之中。我从库珀那里学到的最有价值的一课,就是把一个学科的概念移植到另一个学科是一门艺术。通过将一个领域中的已知理念和另一个领域中的待解决问题进行类比,我们就可以做出新的发现,并开辟一条崭新的探索之路。在我进入库珀组后参与的第一个项目中,这种类比法的魅力就展露了出来。
库珀喜欢研究那些有趣的、看似无法解决的问题,无论它们属于哪一门学科。他会无所畏惧地向最难的问题发起进攻,甚至会修正其他领域中长期存在的错误概念和范式,譬如辐射生理学、神经科学和哲学。在我加入库珀组的那段时间,库珀正在研究神经科学,所以我的物理学研究生涯是从研究大脑开始的。谁能想到,计算神经科学会把我变成一位宇宙学家呢?
当时,库珀正在尝试构建一个基于神经网络的记忆相干性理论。神经网络的一个经典例子是霍普菲尔德模型(Hopfield model),它阐释了联想记忆的工作机制。有趣的是,霍普菲尔德模型并不是源自神经科学,而是源自量子力学机制下的磁理论,更确切地说是以德国物理学家恩斯特·伊辛(Ernst Ising)的名字命名的“伊辛模型”(Ising model) 1 。
想象一个关于磁铁的简化模型,模型中,某种金属(譬如铁)的原子等间距地排成阵列,阵列中的每个原子都由一种被称作“自旋”的性质来确定。量子的自旋和陀螺的自旋很相似。与陀螺不同的是,量子的自旋只能取两个数值中的一个——它要么向上,要么向下,因为原子的自旋是量子化的。原子的自旋不能取一系列任意的值,而只能取这两个量子化的或者离散的值——上或者下。
在这个模型中,任何带电粒子(无论带正电还是负电)只要具有自旋,都可以产生磁场。到目前为止,所有单独的原子都可以用它来描述。然而,当原子结合成一个有序的整体时,它们的相互作用就会形成新的物理现象,一些科学家称之为“层展现象”(emergent phenomenon)。如果所有原子的自旋指向相同,那么它们就会结合起来形成一个净磁场。在正常情况下,这不大可能发生,因为在室温下,环境中的热能足以搅动原子,使它们发生翻转,于是它们的自旋便会随机地选取方向,而不会形成净磁场。
原子与其周边原子之间的效应被称为“相互作用能”(interaction energy),这是一种被储存起来的能量,科学家称之为势能(potential energy)。与物理学中所有形式的势能一样,自然界总是倾向于使其数值变得最小。例如,当你拉紧一根橡皮筋时,它的势能会增加。当你松开它时,它就会啪的一声弹回到原来的位置,把势能消耗掉或者转化为动能。这是一个让势能变得尽可能小的过程。
费曼图阐明了量子粒子之间的相互作用。为了便于理解物理学中的复杂情况,我们引入另一项工具——数学。数学就像一种新事物,它超越了物理感觉的范畴,让我们得以理解那些仅凭自己的认知或直觉所无法理解的事物。事实上,物理学中的许多领域都是高度反直觉的,其他科学(比如化学和生物学)的诸多方面也是如此。若想了解它们所遵循的一致且可理解的规则,我们就必须通过数学来扩展感知。在原子、自旋与磁化的情形下,我们可以用数学来阐释复杂原子系统的行为,具体方法是:先凭直觉来陈述理念,再用数学将这些直觉形式化。我们先从数学的角度来看看库珀的研究中所使用的磁化的伊辛模型。这些细节值得我们花费一些时间,因为其中的许多理念在本书的后续章节中会多次出现。
自旋的数学理论将展示相互作用能( E )如何作用于模型中的原子。当某个原子的自旋发生了改变,与之相邻的原子的自旋会如何变化呢?我们任意选定一个原子 i ,用一个正整数来标识。例如, i =1是1号原子, i =3是3号原子。我们将 i 号原子的自旋记为 S _ i 。于是, i =1指定了 S _1,也即1号原子的自旋,余者类推。与 i 号原子相邻的原子的自旋是 S _ i +1。如此, i =1表示原子1的自旋 S _1,以及与之相邻的2号原子的自旋 S _2。
当相邻原子的自旋相同时, i 与 i +1要么同时向上,要么同时向下(图2-4)。我们凭直觉就可以判断,当二者同向时,它们之间的相互作用能会减少。
图2-4 量子自旋的方向——“向上”态与“向下”态
当相邻原子的自旋异向,也即 S _ i 向上, S _ i +1向下,或者 S _ i 向下, S _ i +1向上,二者之间的相互作用能就会由于异向自旋之间的“绷紧”而增大。我们可以想象两个正在讨论问题的人,如果他们意见一致,那么可供讨论的问题就变少了,所以互动就减少了;如果他们意见不一致,那么他们就会有更多的交流,并试图改变对方的观点。
在数学上,如果我们把“自旋向上”视为正的,把“自旋向下”视为负的,当把这两个自旋结合时,就可以用 S _ i 乘以 S _ i +1,从而得到正的或者负的结果。可能的结果总共只有4种:二者都向上,即1×1=1;二者都向下,即(-1)×(-1)=1;第一个向上而第二个向下,即1×(-1)=-1;第一个向下而第二个向上,即(-1)×1=-1。对于任意一个粒子对而言,如果它们的自旋同向,那么其乘积为 S _ i × S _ i +1=1;如果它们的自旋异向,其乘积为 S _ i × S _ i +1=-1。因此,只要知道值的正负,我们就可以推断出两个原子的自旋是同向还是异向。仅两个数字就揭示出了确切的物理信息,而我们则有了第一个用数学表示的原子自旋模型。
在磁化的伊辛模型(图2-5)的创建过程中,我们凭直觉确定了,当两个相邻原子的自旋同向时,其相互作用能会减小,而当它们自旋异向时,相互作用能会增大。然而,整个原子阵列的相互作用能具体减小或者增大了多少还有待确定。
图2-5 伊辛模型中的自旋方向 S
在写出方程之前,我们先回顾一下模型中的元素:
把系统中所有同向和异向的自旋加起来,我们就可以得出描述粒子之间相互作用能的完整方程:
E 是粒子之间的相互作用能,它等于 S _ i × S _ i +1,自旋同向时取1,异向时取-1。西格玛符号(∑)的意思是把所有的同向、异向对 i 求和,从而得到整个体系中同向和反向的数值。请注意,如果它们全部同向,那么最终的和就是一个很大的正数;而如果全部反向,和就是一个很大的负数。
J 表示由所有的同向、异向共同确定的和所决定的相互作用能。 J 越大,自旋之间的相互作用能就越大。例如,如果 J =0.1,而所有同向的和恰巧是400,那么能量值就是40。最后,负号意味着,自始至终我们都认为同向会减少作用能、异向会增加作用能,所以在这个例子中,相互作用能是-40。
当相互作用能由于异向自旋而增加时,单一同向原子产生的小磁场是受限的,所以金属不会对外产生磁性。但是,如果相互作用能因为大量同向自旋而减少时,小磁场的积累效应便会叠加起来。总之,最小能量的状态对应着自旋全部同向的状态,在这种情况下,物质会产生磁场,并因此变成了磁铁。势能也会变得最小,相当于橡皮筋处于最初的位置。当磁性最强的材料铁原子自旋同向时,它就变成了铁磁性材料,而描述铁磁性的数学模型就是伊辛模型。
伊辛模型的重要之处在于,它考虑了量子物理在确定金属能否成为磁性材料时的影响。当然,还可以加之于其他的外界条件,譬如外磁场存在时的情形,但我们现在不是为了探究磁性的内在机制,而是要阐释铁磁性的伊辛模型如何导出神经科学上的霍普菲尔德模型。让我惊讶的是,描述磁性的伊辛模型和描述神经网络的霍普菲尔德模型看起来完全无关,但前者竟直接为后者提供了灵感,所以这个类比十分贴切。
霍普菲尔德模型是神经元回路的经典模型。在伊辛模型中,金属中的原子自旋产生相互作用能,霍普菲尔德模型借用了这个理念,并将其重构为大脑神经元中可交流的相互作用,由此得到了一个神经网络系统。这个系统利用极其简单的规则和数学来有效地储存习得的记忆,这样我们就可以检索或者记起往事。粗略地说,我们可以把本地有关联自旋的岛屿的形状看作可以存储记忆的结构。
实验证明,神经元之间以“激发”的形式进行交流,也即在神经元连接处释放神经传导物质。这些连接处被称为突触。通过引入两个神经元之间的相互作用“强度”(相当于伊辛模型中的 J ),约翰·霍普菲尔德(John Hopfield)把这种复杂的传输过程简化了。不过,在霍普菲尔德模型中,事情并没有这么简单。在伊辛模型中,自旋只与最近的原子发生相互作用,但在我们复杂的大脑中,所有的神经元都彼此相连。伊辛模型中的自旋和霍普菲尔德模型中的神经元激发才是关键的类比。如果神经元的数值是“向上”,那么神经元就激发了一个电化学信号;而如果神经元的数值是“向下”,那么神经元就没有被激发。
对于彼此连接的神经元晶格的全部“状态”,霍普菲尔德提出了一个方程,并把它类比为存在相互作用的铁原子阵列的总能量。支配着伊辛模型的数学原理也支配着霍普菲尔德模型:两个同时被激发或者同时不被激发的神经元会增加关联状态数,而表现相异的神经元则会减少关联状态数。我们只需把表示自旋的变量 S ( S _ i , S _ i +1,……)替换为神经元变量 n ( n _ i , n _ i +1,……)即可,因为两个模型几乎是相同的。
根据大脑中神经元的关联度,我们为每个神经元对引入分立的不同数值,以代替原来的每对粒子改变总状态的单一项 J 。这个模型中的新变量是神经元 i 和神经元 j 之间的权重 w ij ,它决定了一个特定神经元 i 与它的相邻神经元 j 之间相互交流的强度——连接两个神经元的突触的效能。我们设定这些关联强度是霍普菲尔德模型的核心。这个阵列可以形成诸多截然不同的状态,这些状态在数学上由整个阵列的关联强度模式决定。
这个类比有其局限性,毕竟人类的记忆显然比一块磁化的金属更为复杂。 2 人类有鲜活的生命,可以自我控制。基于这些模型的神经网络也可以不断学习。在库珀实验室中,我的工作是研究无监督神经网络,它们是那些神经网络的延伸。霍普菲尔德网络必须通过学习才能训练自身的突触识别模式,相比之下,无监督网络可以进行自我训练,以习得新的记忆。当待处理的数据非常多,而又没有事先给定分类方法时,无监督神经网络就派上用场了。这个网络假定了一种能识别这些数据所属的自然类别的智能程序。通过无监督学习来进行“数据挖掘”的海量数据库的例子有很多,比如人造卫星图、股票交易图和推特上的推文等。在把一个领域中的概念引入另一个领域方面,霍普菲尔德模型是一个经典案例,而它也解释了为什么我从事着神经科学研究,最终却拿到了物理学学位。
在库珀组工作的过程中,我发现了两件重要的事情。首先,观察两个领域中的相似模式,并将其中一个领域中的模式应用于另一个领域,这一过程展现出的价值与美令我永生难忘。跨领域应用类比法不只是纯粹的科学,更是一门艺术。在音乐中也是如此,尤其是当不同的音乐传统混合在一起时。例如,柯川就曾将其他文化中的乐器融入爵士乐传统,他巧妙地把印度拉格(Raga) 系统融入自己的即兴演奏,后者因此变得极为有趣,因为一些印度音阶与莫达尔爵士乐之间有着许多相似之处。这种融合在柯川的著名歌曲《我的最爱》中也出现过。其次,我发现这些类比总有其局限性,不过,正是它们的局限性为新的见解和发现提供了生长的土壤。在霍普菲尔德模型中,把神经元看作磁铁中的一个具有自旋的量子就是一个有用的类比,它为神经科学家提供了物理学家最初计算磁性时所使用的计算工具。当然,这种类比并不完美,因为神经元是以一种远比金属中的自旋更为复杂的方式连接在一起的。由于这种局限性是众所周知的,所以神经科学家能把精力放在将电路的复杂性引入这个类比模型上,从而不断完善它。作为库珀组中的一个新成员,我曾经致力于为我正在研究的一类特殊的神经网络寻找一个新的类比。那时,我并不知道它将源自宇宙。