场论与量子力学的结合产物是量子场论。量子场论早期遇到的困难是紫外发散。发散对物理学家来说并不陌生,洛伦兹和庞加莱在古典电子论中已经遇到了发散,就是电子的无限大自能。他们假定电子的半径不为零,这样就得到了有限的结果。非常令人惊奇的是,如果假定电子的能量完全来自自能,他们的结果与爱因斯坦的著名的质能关系几乎一样。而洛伦兹的结果出现在1904年,比爱因斯坦发现狭义相对论早了一年。另外一种发散导致普朗克早几年引进量子的概念,这就是黑体辐射的紫外灾难。
紫外灾难与电子的无限大自能的不同之处在于,后者是由于电荷集中在无限小的区域,而造成前者的原因是一个固定的相空间区域有无限多个态。普朗克引进量子使得每一个态占据一定的相空间,因此黑体辐射作为一种自由理论变为有限。量子论并没有解决相互作用的发散问题,因为这种发散的根源是,在一个固定的空间区域有无穷多个自由度。换言之,对应一个有限的空间区域,其相空间为无限大,我们必须计及无限大的动量空间。所以,普朗克的量子“正规化”了相空间,并没有将空间“正规化”。
一种人为的正规化办法是在动量空间引进截断,也就是说我们在做计算的时候假定有一个最大的动量。通过测不准原理,这样做等价于在空间上做一个小距离截断。从场论的观点讲,这等于我们假定所有的场在小于一定的距离上没有变化。这样做既排除了经典上的发散,如电子的无限大自能,也排除了新的量子发散。新的量子发散来自小距离上的量子涨落,如正负电子对的产生和湮没。当截断被去除后,通常我们还是得到无限大的结果,这就迫使人们引进“重正化”。重正化的办法是引进所谓裸参数,如电子的质量和电荷,这些裸参数是截断的函数。而物理参数仅是物理过程涉及的能量的函数,其来源分成两部分,一部分是裸参数,另一部分来自介于截断和物理能量之间的量子涨落。如果所有的无限大都能用重正化来消除,我们则称该量子场论是可重正的。
以上的重正化观念是老的观念,也就是费曼、施温格和朝永振一郎所采用的办法,现在又叫粒子物理的重正化观念。现代有效量子场论并不要求这种可重正性。在有效量子场论中,如果我们仅仅对一定能量以下的物理现象感兴趣,我们可以将高能的模“积掉”,也就是说高能模对低能模的效应可以由低能模的有效哈密顿量(Hamiltonian)或者拉格朗日量(Lagrangian)完全体现出来。不同的高能拉氏量可能产生相同的低能拉氏量,如果我们仅对一定能量以下的物理感兴趣,高能的行为就无关紧要了。一个不可重正的理论在高能区需要越来越多的参数,所以,用现代量子场论的观点来看,可重正性等价于高能区有一个不动点,这就是可重正性的可预言性的全部含义。
所以,我们并没有理由要求我们的粒子模型一定是可重正的。粒子物理的标准模型恰恰是可重正的,严格来说,这并不意味着标准模型有一个紫外(高能)不动点,但肯定意味着标准模型可以被放进一个更大的、有紫外不动点的理论。这个事实本身,从有效量子场论的角度来看,已经耐人寻味。如果把引力包括进来,我们有理由要求整个理论是可重正的,因为引力本身已经蕴涵着一个能量极限,也就是普朗克能量。当然我们也可以假定在普朗克能量之上还不断地有新的物理上有兴趣的内容,但这种哲学与统一观点背道而驰。也许,标准模型的可重正性以及弦论作为可重正的(其实是有限的)引力理论的存在是对持统一观点的人的极大支持。
有两种方式判定一个理论是否是可重正的。通常用的办法是微扰展开,就是从一个自由理论,即没有相互作用的理论出发,再加上一些相互作用项,而每一项有一个对应的参数,通常叫做耦合常数。如果某个参数带有长度量纲或长度量纲的正幂次,我们称该项为无关项(irrelevant term);如果对应的参数带有长度量纲的负幂次,则称该项为相关项(relevant term)。通过量纲分析可以知道,无关项在低能区会变得不重要(“无关”因此得名)而在高能区变得重要,原因是其影响可通过一个无量纲参数,即耦合常数乘以能量的正幂次来确定。如果某一无关项在一能区存在,那么它在更高的能区会引出更多的不同的无关项,所以无关项是不可重正的。
引力所对应的耦合常数是牛顿引力常数的平方根,所以引力是不可重正的。这个事实可以用以下的简单方法看出:爱因斯坦理论是非线性的,它的第一个相互作用项是度规场的立方项,其对应的耦合常数是牛顿引力常数的平方根。在4维中,如同任何一个玻色场,引力场带有质量量纲,即长度量纲的倒数。立方耦合项一定含有两次微分,这同样可以通过量纲分析来看出,因为耦合常数有长度的量纲。一个相互作用项所含的微分次数越高,它对量子涨落的发散的贡献越大,因为该项在高能区变得越来越大——每增一次微商,就多了一个能量因子。为了消除这些发散,我们就不得不引进越来越多的无关项,这样引力没有一个在高能区有好的定义的理论。
顺便提一下,我们前面说引力的最简单的相互作用项含有两次微商,这与引力子是自旋为2的粒子有关。一般的规范场所对应的量子自旋为1,其简单的相互作用项含有1次微商。更为一般的结论是,自旋为几的粒子所对应的相互作用必定含有几次微商。所以,一个含有自旋为3粒子的理论一定是不可重正的。在4维中,可以证明,可重正的量子场论最多只含自旋为1的粒子,这是20世纪70年代初量子场论的重要结果。人们实际上得到更强的结论,所有可重正的、含有自旋为1的粒子的量子场论必为规范理论,即杨-米尔斯理论。
我们上面提到,以威尔逊(K.Wilson)的现代场论观点来看,我们没有理由要求引力是可重正的。也许真实的图像是,当我们不断地提高能量时,物理理论会变得越来越复杂,而爱因斯坦的理论只不过是一个低能有效理论。虽然我们不能完全排除这种可能,但我们提到的普朗克能量的存在暗示着在高能区存在一个简单的量子引力理论。黑洞的存在也支持这个可能性。设想我们用带有很高能量的粒子束来探测小距离上的时空结构,如果没有引力,海森伯测不准原理告诉我们能量越高,我们能探测的距离越小。引力介入后,过去很多人,特别是惠勒(J.A.Wheeler),相信越高的能量会带来越大的时空涨落,如所谓的时空泡沫(spacetime foams)。时空泡沫指的是在普朗克距离上时空的拓扑不确定,有许多虫洞(wormholes)结构。黑洞的形成使得这些如时空泡沫的结构能否被观察到成为很大问题。能量越高,形成的黑洞就越大,其事件视界(event horizon)也就越大,所有可能的复杂的时空结构都被视界所掩盖。而视界之外的时空却非常光滑,能量越高,视界之外的曲率就越小,那么低能的有效理论也就越适用。如此,对于一个外部观察者来说,高能的量子引力行为就不可能被复杂的拉氏量中的无关项所主导。我们这里所描述的可能性现在叫做紫外/红外对应,即量子引力中的紫外行为与红外物理相关。
如此,我们相信在一个有引力的量子理论中,高能理论不会像有效量子场论所指出的那样,在高能区存在许多不可预测的可能性。量子引力本身必定是有简单定义的理论,换言之,量子引力是一个更大的、可重正的甚至是有限的理论的一部分。这个理论不太可能是爱因斯坦理论的简单量子化,因为我们已知道爱因斯坦理论不可能被简单地量子化。这就迫使我们寻找一个更大的,至少是可重正的理论。我们将被历史地,在某种程度上也是逻辑地带到超对称。
超对称作为一种理论上的可能的发现是一段饶有趣味的科学史。在读完前面关于场论中的无限大之后,也许我们会想当然地猜测超对称的发明是为了消除无限大。20世纪70年代初超对称不同的发现者有不同的理由发明超对称,却没有一个理由是为了将无限大驱逐出量子场论。
苏联物理学家高尔芳(Y.A.Golfand)早在20世纪60年代末就开始寻找介于玻色子与费米子之间的对称性,他的动机是解决弱相互作用!当时温伯格-萨拉姆(Weinberg-Salam)模型还没有建立,温伯格关于弱电统一的文章发表于1967年。根据高尔芳的学生,他后来的超对称合作者利希特曼(E.Likhtman)的回忆,高尔芳在1968年春已得到4维的超庞加莱代数(super-Poincaré algebra),这比西方发现超对称早了三年,比西方发现4维的超对称早了六年。可惜高尔芳并没有立即发表这个结果,因为他虽然克服了所谓的柯尔曼-满杜拉止步定理(Coleman-Mandula nogo theorem),但还没有构造好实现这一对称的场论。这与目前信息时代的物理学家的发表态度形成鲜明的对比。我们可以在前天看到同行在网上贴出的文章,昨天做了一点推广式的计算,今天草就一篇大作,明天就可在网上见面。顺便提一下,当我和人聊起超对称的发明的时候,常常有人错误地将之归功于数学家盖尔芳(I.Gelfand)。盖尔芳比高尔芳有名得多,是第一届沃尔夫数学奖得主,生于1913年,比高尔芳大9岁。盖尔芳还活着且仍在发表文章(网上能查到的最新文章出于2001年9月),而高尔芳已于1994年辞世。
也是原苏联物理学家,现今在明尼苏达大学的谢夫曼(M.Shifman)曾组织人为高尔芳出了一本纪念文集。读了谢夫曼写的前言,我才知道高尔芳在1973年至1980年之间失了业。他与利希特曼的第一篇关于4维超对称场论的文章发表于1971年(比西方第一篇4维超对称场论的文章早了3年),是关于(用现代的术语讲就是)超对称量子电动力学的。那么,高尔芳为什么在发表了如此重要的文章后被列别捷夫物理研究所(Lebedev Physical Institute)解聘呢?谢夫曼提供了两个可能的原因。一是,朗道发现了所谓的朗道极点之后苏联很少有人相信场论(在整个20世纪60年代,西方的大多数粒子物理学家对场论也失去了信心,原因是弱相互作用不可重正,而强相互作用更是一团乱麻),他们比西方人更为保守。其二是,有人认为高尔芳根本不懂他研究的东西,尽管他早在20世纪50年代末就做过重要工作。高尔芳因此就成了苏联科学院“精简创新”的牺牲品。我们在这里猜测,如果外斯(J.Wess)、朱米诺(B.Zumino)1974年的文章早发表两年,如果西方早两年就重视超对称,也许高尔芳的运气要好一些。高尔芳1990年举家去了以色列。
在西方,超对称的发现顺着完全不同的思路,最早的超对称的发现竟源于弦论。拉蒙(P.Ramond)当时在费米实验室工作。1971年,弦论被正式确认只有一年,他考虑如何在弦论中引进带半奇数自旋的激发态(即费米子)。作为狄拉克矩阵的推广,他在弦运动起来的世界面上引进了费米场,并令其满足周期条件。非常类似狄拉克,拉蒙的理论中所有弦的激发态都是时空中的费米子。注意,这里我们有意将时空与世界面区别开来,前者是弦运动的舞台,而后者类似粒子的世界线,虽然拉蒙的理论中只有时空中的费米子,而弦的世界面上既有费米场,也有玻色场。这些我们留到后来再详加解释。同年,吉尔维(J.Gervais)和崎田文二(B.Sakita)发现,如果将拉蒙的理论写成世界面上的作用量,则这个作用量具有2维的超对称。这是出现在西方的第一个超对称作用量,与苏联人几乎同时。拉蒙的理论现在又叫拉蒙分支(Ramond sector),因为它是两种可能的分支之一。
拉蒙,超对称弦论的创始人之一,离开费米实验室后一直在佛罗里达大学工作。虽然是弦论的创始人,但他后来的工作集中在粒子唯象学上,特别是中微子物理。除了唯象学外,他对群论的应用一直很有兴趣,同时也对物理界的一些掌故有兴趣。这张照片摄于亚斯本物理中心,他每年夏天去的地方。
作为一个小插曲,我们谈一点关于拉蒙的掌故。拉蒙并没有因为第一个研究费米弦而得以永久留在费米实验室,尽管他在弦论中第一次引入费米的名字。现在费米实验室理论部的有些人谈到这件往事时往往半自嘲、半开玩笑地说,我们费米实验室从来不做弦论,我们已将超弦的创始人之一给解聘了。拉蒙是很有幽默感、很健谈的人,也很喜欢谈掌故。我记得有一年夏天在亚斯本遇到拉蒙,在一次午饭聊天中,他向一些年轻人讲我们在前面提到的威尔逊(K.Wilson)的故事。有人问他,如果威尔逊没有发现重正化群和临界现象的重正化群理论,谁会发现它?(在此之前拉蒙已谈到一些量子场论中的大人物,为了不得罪人,我们姑且将姓名隐去)他说,坎(Ken,威尔逊的名字)。再问一次,他仍然说坎。可见他对威尔逊的佩服程度。当然,绝大部分真正懂威尔逊理论的人都很佩服他,不懂就无从佩服起了。拉蒙也是自己的名字在一个专业名词中出现两次的少数人之一,这个名词就是超弦中的拉蒙-拉蒙分支。有一次他访问芝加哥,参加一个超弦的学术演讲。当时他是听众之一,我也有幸在场。当演讲者提到拉蒙-拉蒙分支时,听众中的哈维(J.Harvey)扭头问他:“皮埃尔,另外一个拉蒙是谁?”全场大乐。
写到这里,真想再一次遇到他,尤其在我写这个史话的时候,这样可以从他那里贩卖一些关于弦论的掌故。像现在这样写下去,迟早要抖尽肚皮里的一点点存货。
以上是大家爱听的“八卦”,现在是谈一谈到底什么是超对称的时候了。我们先从大家熟悉的对称性讲起。日常的对称性有分立对称性和连续对称性,前者如一个正四边形,将之转动90°,还是原来的正四边形;后者如一个球面,以球心为原点,无论怎么转,还是原来的球面。这是一个物理系统固有的对称性,或一个物理态的对称性。在物理理论中,还有一种动力学的对称性。例子是,假如一个态本身不是转动不变的,但我们将之转动后,同时还转动用以描述它的坐标,这样这个态的一切动力学性质和转动之前完全一样,这表明空间本身的各向同性跟物理系统本身与空间的方向无关联性。在一个物理理论中,一个转动操作对应于一个算子,它将一个态映射到另一个态。现在,前面例子中的两个性质可以翻译成数学语言。空间本身的各向同性等同于真空本身作为一个特别的态在这个算子的作用下不变;物理系统本身与空间的方向无关联性等同于这个算子与哈密顿量对易(量子力学)或它与哈密顿量的泊松括号为零(经典力学)。
量子力学的法则告诉我们,一个算子如与哈密顿量对易,则它所对应的物理量是守恒的。对应一个转动算子,我们还没有一个物理量,原因是,这个转动算子是保长的,即保持态的内积不变,如我们提到的真空态。这样的一个算子叫幺正算子,而一个物理量算子是厄米算子。连续群的定理保证我们可以用厄米算子构造幺正算子,对于转动来说,相应的厄米算子就是角动量。如果真空在幺正算子作用下不变,那么它在相应的厄米算子的作用下为零,也就是说真空没有角动量。我们可以将不同的态分类成角动量的本征态,但是一个任意态未必是本征态。
在量子场论中,有一类算子永远没有物理的本征态,尽管它们可以是厄米的,这一类算子就是费米算子。怎么理解一个费米算子?可以将所有物理态分成两类,一类是玻色态,另一类是费米态。现在,定义一个费米算子,它将一个玻色态映射到一个费米态,将一个费米态映射到一个玻色态。这还不是全部定义,我们再加上一个条件,就是,任一个可实现的物理态不是玻色态就是费米态,而不能是一个玻色态和一个费米态的混合。这样,很明显,一个费米算子就没有物理的本征态。根据量子力学,一个费米算子就不是一个可观测量。
尽管如此,一个费米算子可能与哈密顿量对易,也就是说在它的作用下,动力学是不变的,这就是一个超对称。超对称之所以是超的,原因是它将一个“超选择分支”(super-selection sector)映射到另一个“超选择分支”。最简单的情形是,它将一个玻色子转动成一个费米子。这个性质与通常的对称性很不相同,通常的对称性是将两个态联系起来,这两个态完全可以通过动力学过程互相转变。如一个向上自旋的电子,通过转动变成向下自旋的电子,这个转动完全可以通过一个物理过程来实现。而一个超对称变换可以将一个电子变成一个标量粒子,但一个电子本身永远不会通过一个物理过程变成一个无自旋的粒子。我想,这种性质对一个初学超对称的人来讲是一个最大的困惑,因为我们太习惯于普通的对称了。我们可以想象转动一个正方形,但不能想象将一个正方形转成一个“超正方形”,如果后者果真存在的话——因为这种转动不是一个物理过程,该转动不是可观测量!
超对称除了“超”(没有对应的物理过程,也不是可观测量)外,具有一切与普通对称相同的性质。例如,如果一个玻色系统(如两个玻色子或两个费米子或十个费米子)有一定的能量,在超对称变换后,我们得到一个费米系统,这个费米系统无论与前面的玻色系统怎样不同,都与之有着相同的能量。再如,如果我知道两个玻色子在一个束缚态中的相互作用能量,通过超对称变换,我就知道变换后的一个费米子和一个玻色子在一个束缚态中的相互作用能量。原因很简单,就是这个超对称保持动力学不变,它与哈密顿量对易。
通过上面的解释我们看到,超对称既有类似于一般对称性的地方,也有很不相同的地方。这种不相同的地方往往会引起初学者的迷惑,由此可知对于发明超对称的人来说,非凡的想象力和胆量是不可或缺的。
那么,既然超对称原则上可以存在,什么样的超对称可以在相对论量子场论中实现呢?对于一般对称性来说,我们要求有一个群结构或李代数结构。一个转动后再做一个转动,我们还是得到一个对称转动,这是群的结构。这个要求在无穷小的变换下就可翻译成李代数的要求。现在,我们将这个要求加于一个对称元和一个超对称元,我们得到的结论是,这个对称元和一个超对称元的对易子必是另一个超对称元。如果我们想用超对称元来构造群,我们就得用一种新的数,相互间是反对易的,叫格拉斯曼(Grassman)数,原因还是因为超对称不是通过物理过程实现的对称,所以其对应的转动参数不是实数或复数,否则我们可以问这个参数的物理含义是什么,就像通常转动的转动角一样。
以上所写,已经不很通俗了,我还没有更简单的办法,如有,就得像费曼写QED(量子电动力学)一样,上面的一段话将被拉长几倍或几十倍。所以为了节省大家的时间,特别是作者自己的时间,我们还是假定读者已有一定物理背景,或是天才儿童。
回到原来的话题,什么样的超对称是允许的。我们已说到一个超对称元和一个对称元的对易子必是一个新的超对称元,把所有这样的对易子放到一起,我们发现超对称元的集合形成对称李代数的一个表示。在相对论量子场论中,最重要的对称就是庞加莱对称,所以超对称元形成庞加莱代数的一个表示。在4维中,最简单的费米子表示就是旋量了。超对称中有几个这样的旋量,我们就说这是N等于几的超对称。高尔芳和利希特曼1971年发表的场论就是N等于1的超对称场论。
在西方,最早的超对称是在弦的世界面上发现的,这就是1971年的吉尔维-崎田文二2维超对称场论。弦论中的时空超对称的发现是很后来的事,我们等一会儿再谈。朱米诺似乎是注意弦论中时空超对称的第一人,这也许启发他后来与外斯一道发现4维的超对称和超对称场论。1974年,外斯和朱米诺构造了4维时空中最简单的超对称场论,这个场论只含一个基本的旋量场(只有两个自旋为1/2的粒子,形成一个旋量表示),两个标量场。之所以有两个标量场也是由于有超对称,因为根据我们之前所说的道理,有多少费米态就应当有多少玻色态。这个最简单的超对称场论一般称为外斯-朱米诺模型,是两个外斯-朱米诺模型之一。另外一个外斯-朱米诺模型完全与超对称无关。
朱米诺,和外斯一同发现了4维超对称,也是超引力理论的发现人之一。他由于超对称的发现获得了意大利国际理论物理中心的狄拉克奖章。朱米诺的有名工作几乎都是与外斯一同完成的,除了超对称之外,著名的外斯-朱米诺作用量在现代场论中占有显著的位置。朱米诺是那种大器晚成的典型,发现超对称时已超过50岁,现在还非常活跃。
朱米诺应是所有年纪稍大而事业上尚无大成的人的榜样,因为他是一个大器晚成的人。我经常以朱米诺的例子来期许自己和他人,也许我最终也难成大器,但这仍不失为取法其上得乎其中的办法。在1973年底,他和外斯完成4维超对称的理论时,已超过50岁,外斯也接近40岁了。他与外斯的另一重要工作,即另一外斯-朱米诺模型也不过是1971年的作品。毫无疑问,超对称是他一生中最重要的工作。我还不知道在粒子物理这一竞争激烈的领域,是否有第二个人能在五十开外做出他一生最重要的工作。
朱米诺和外斯在同一年将他们的超对称场论推广到含有自旋为1的粒子,即光子的情形,这也就是三年前高尔芳和利希特曼构造的理论。朱米诺和外斯还研究了这个理论的量子性质,发现超对称有助于使紫外发散减弱,当然他们在第一篇文章中已讨论过量子行为。
接触过量子场论的人都知道,任何场论中都有发散的零点能。对于一个自由场论来说,场的每个傅里叶模是一个谐振子,根据量子力学的测不准原理,谐振子不可能处于能量为零的状态,它的最低能不为零,这就是零点能。当谐振子处于第一个激发态时,对应于一个基本的量子,或粒子,其动量和能量与这个模相同,而零点能只有一个粒子的一半,所以不能将它解释成一个可观察到的物理态。我们因此将之归于真空的能量。将所有模加起来,这个能量是无限大。这个无限大显然来自紫外的模,我们在本章中提到过,这对应于空间在小尺度上没有截断。奇怪的是,来自一个玻色子的零点能是正的,而来自一个费米子的零点能是负的。如果对应一个玻色子存在一个有相同质量的费米子,那么两者的零点能就完全抵消。超对称理论恰恰有这种性质,所以超对称理论中,我们无需人为地扔掉自由场的零点能。
对于每一个场,如果我们引进动量上的截断,零点能的密度则是这个截断的4次方,这是4维场论中最大的发散。考虑一个可重正的场论,如果理论中没有标量场,除去零点能外,最严重的发散是对数发散,如量子色动力学。标准模型含有标量场,就是希格斯(Higgs)场,标量场涉及的最严重的发散是二次发散。这种发散带来所谓的等级(hierarchy)问题。等级问题最简单的描述是这样的:标准模型中的最大能标是弱电自发破缺能标,大致可以看成是希格斯场的一个耦合参数,数量级大约是100 GeV(吉电子伏)。考虑在标准模型之上还存在一个新能标,如普朗克能标,假定在弱电能标和这个新能标之间没有另外能标,通过重正化流,这个新能标会在标准模型的各个参数中体现出来,如弱电能标。由于标量场的二次发散性,弱电能标含有一个与新能标的平方成正比的项,另一项是弱电能标这个耦合参数在新能标上的“裸”参数。我们要求弱电能标是100 GeV,我们就必须要求其“裸”参数与新能标的平方几乎抵消,这就是所谓的微调问题(fine tuning)。有了超对称,与新能标的平方成正比的项不再存在,所以20世纪80年代初很多人研究超对称大统一理论。这是超弦集团之外的唯象粒子物理学家相信超对称存在的主要原因之一。
超对称的生成元越多,无限大的抵消就越成功,但人们为此付出的代价是模型越来越不现实。当理论有8个超对称元,也就是N等于2的超对称情况下,极小理论中的费米子增加到4个,不再是具有唯一手征的理论,但是标准模型中的弱相互作用破坏宇称,必须是带手征的。如果我们暂时不管这个实际问题,一直增加超对称的数目,就会发现当超对称元的个数超过16时,我们不得不引进自旋为2的粒子以构造超对称多重态,这样就引进了引力。所以不包括引力的最大超对称有16个元,也就是N等于4的超对称。实现这个超对称的场论一定包含规范场。这类场论几乎是唯一的,只有两个参数可以改变,一个是规范群参数,亦即群的种类和阶数,另一个是耦合常数。这类极大超对称场论在20世纪80年代初被三组不同的人证明是完全有限的。而实现N等于2的超对称场论在微扰论中只有单圈发散。
N等于4的超对称规范理论的有限性在当时看来是唯一的。记得有一位德高望重的人说,他当时相信这个理论一定有很大的用处,因为上帝造出这么完美的理论而不加利用是不可能的。不过他等了几年,人们并没有发现这些理论与粒子物理有什么关系,他从此就再也不相信超对称理论有什么用处了。N等于4的超对称规范理论的确有许多与众不同的地方,后来它们在超弦发展中起了很大作用,如强弱对偶,反德西特尔空间上的量子引力与超对称场论的对偶(AdS/CFT对偶)等。
也是在1974年,萨拉姆(A.Salam)和斯特拉思迪(J.Strathdee)在看到外斯、朱米诺的工作后很快发现了超空间表示。发现这一点似乎不需要太多的想象力,如果通常的对称性与可观察到的时空有关,如空间的平移和空间中的转动,那么超对称就应和超空间有关。的确,萨拉姆和斯特拉思迪证明超对称变换可以被看成超空间中的平移。这些超空间的坐标是格拉斯曼数,从而是不可观察到的,这正类似于超对称变换不是实验室中可实现的变换。但是,如果人们将来发现超对称粒子,就等于间接地发现了超空间。我为了写这段话查了一下萨拉姆和斯特拉思迪当年的文章,发现虽然预印本是1974年11月的,发表该文的《核物理》(Nuclear Physics)的那一期竟也是1974年的。可见发表的速度实在与是否处在电子信息时代无关。虽然我说发现超空间不需太多的想象力,但这并不意味着对于一个新手来说超空间是很容易接受的。记得当年年轻气盛,考研后问我的老师什么是最时髦最有前途的研究方向,老师随手从书架上拿了一本法耶(P.Fayet)和费拉拉(S.Ferrara)1976年写的超对称综述。我拿回去之后发狂猛啃,很坐了一段飞机。现在回想,如在昨日。当年对超对称的生吞活剥也许在日后起了一点作用。
谈过超对称量子场论之后,我们回到弦论中的超对称这个话题。毕竟超对称在西方的发现源于弦论,所以应当追溯一下历史以了解超对称、超引力在西方发展的脉络。这样做正符合孔夫子所说的温故而知新。
萨拉姆,因发现弱电统一理论与温伯格和格拉肖分享1979年度诺贝尔物理学奖。他创办了位于意大利的利雅斯特的国际理论物理中心,并担任中心主任,1996年去世。除了他的获奖工作外,萨拉姆与斯特拉思迪引进的超空间概念是他许多贡献中最著名的。
我们曾谈到拉蒙在弦论中引入了费米子,所有弦的模式在时空中的体现都是费米子,因为他在弦的世界面上引入了类似狄拉克矩阵的东西。世界面上因此有了超对称,但时空中没有超对称,因为只有费米子。从某种意义上来说,狄拉克1928年引入狄拉克矩阵就等于在粒子的世界线上引进了超对称。狄拉克算子的平方是达朗贝尔算子,就如同超对称算子的平方等于哈密顿量。1974年,法国人内沃(A.Neveu)和我们在第一章就提到的施瓦茨希望能在拉蒙的模型中加入时空中的玻色子。为了避免狄拉克矩阵的出现,他们要求拉蒙的世界面上的费米场没有零模,这样所有的模的阶就必须是半奇数,换句话说,世界面上的费米场满足反周期条件。这样构造出的弦的激发态都是时空中的玻色子。这个新的分支叫内沃-施瓦茨分支,独立于拉蒙分支。注意,对于内沃-施瓦茨分支来说,世界面上仍有超对称,因为世界面上的超对称是局域的。当然,1974年还没有人知道什么是局域超对称,在超引力发现之后,1976年布林克(L.Brink)、蒂韦基亚(P.di Vecchia)、豪(P.Howe)等人才发现原来的2维世界面上的超对称其实是局域的。后文更详细地谈超弦的时候,我们还要回过头来谈2维局域超对称的重要性。
将费米弦的两个分支——拉蒙分支和内沃-施瓦茨分支加起来,似乎就有了时空超对称,可事情并没有这么简单,超对称的一个基本要求还没有被满足,就是给定一个质量,必须有同样多的玻色子和费米子。要等到1976年,也就是外斯-朱米诺工作的两年之后,一个“意法英联军”,廖齐(F.Gliozzi)、舍克和奥立弗(就是那位奥立弗-蒙托宁对偶中的奥立弗)发现可以将两个分支中的一些态扔掉而不破坏理论的自洽性,这样得到的理论有同样多的玻色子和费米子。他们还不能立刻证明时空超对称,但他们做了这样的猜想。要再等五年,这个经过所谓的廖舍奥投射(GSO projection)的拉蒙-内沃-施瓦茨理论才由格林(M.Green)和施瓦茨证明具有完全的时空超对称。他们也同时证明,这些超弦理论包含相应的时空超引力。
超对称被发现之后,对一部分人来说,超引力的存在就是显而易见的事了。杨-米尔斯构造规范理论不久,内山菱友(R.Utiyama)就用规范对称重新解释了爱因斯坦的引力理论。对于内山来说,引力场无非是对应于时空平移的规范场,也就是说,如果我们要求时空平移不仅仅是整体对称性,同时也是局域对称性,我们就要引进引力场来使平移“规范化”。超对称是时空对称性的推广,特别是,两个超对称元的反对易子给出一个时空平移。这样,如果我们将时空平移局域化,我们就不得不将超对称也局域化,反之亦然。如此得到的理论就是超引力。在这个理论中,对应于时空平移的引力场仍在,对应于超对称的规范场是自旋为3/2的场,通常叫做引力微子,是一个费米场。有一个简单的方法来判断规范场的自旋:如果局域对称性是一种内部对称性,也就是说对称元不带时空指标,那么相应的规范场比对称元多一个时空的矢量指标,相应的粒子自旋为1;如果对称元带一个空间矢量指标,则规范场带两个空间矢量的指标,这就是引力场;进一步,如果对称元带一个旋量指标,如超对称,那么规范场就多带一个空间的矢量指标,这个场就是引力微子场了。
首先在4维时空中构造超引力的三位中有两位当时在纽约州立大学石溪分校。1976年以前,三位仁兄各做各的事情。范纽文豪生(P.van Nieuwenhuizen)基本做引力的微扰量子化,明显是受了他的老师韦尔特曼(M.Veltman)的影响,弗里德曼(D.Z.Freedman)大约是个唯象学家,费拉拉(S.Ferrara)则是唯一专心做超对称的。当然他们都有研究唯象学的底子。据范纽文豪生说,他们的第一个超引力模型,4维的N等于1的超引力,一半是靠手算,一半是靠计算机折腾出来的。记得我当年于生吞活剥法耶-费拉拉之后,接着去找来范纽文豪生的超引力综述,这回更是云山雾罩:什么1阶方式(first order formalism),2阶方式,最后又搞出1.5阶方式。1阶方式大约是说,你将度规场和联络场都看成是独立的场,2阶方式则将联络看成是度规的函数,天知道1.5阶方式是什么,有兴趣可参看范纽文豪生的综述。
一个最简单的、经典的超引力已将人折腾得七荤八素,更不用说复杂的超引力了。N等于2以上的都叫推广的超引力(extended SUGRA),当然这种翻译有点勉强。我当时觉得还是称泛超引力来得简洁些,省了两个汉字,现在看来,干脆就叫超引力算了。4维中有很多不同的泛超引力,一直到N等于8。当N超过8时,就必须引进自旋大于2的场了,这从场论的角度来看似乎是危险的,因为人们不知道如何构造自洽的场论。N越大,对称性越高,场的数目就越多。广义相对论中只有10个场,就是度规的分量,在N等于8的超引力中,仅标量场就有70个。场多了的好处是,有可能将标准模型中所有的场都纳入一个超对称多重态中,坏处是作用量越来越复杂,不是专家不可能写对作用量。从统一的角度看,N等于8的超引力还是不够大,因为规范群是O(8),还不能将标准模型的规范群放进去。超引力除了可以在N的方向推广,也就是引进越来越多的超对称,也可以在D的方向推广,就是引进越来越高的维数。D最大的可能是11,再大就要引进高自旋场。这两个方向实际上是相关的,低维的泛超引力可以由高维的简单一点的超引力通过维数约化(dimensional reduction)得到,如4维的一些N等于2的超引力可以由6维的N等于1的超引力得到。而4维的N等于8的一些超引力可以由11维超引力通过维数约化或紧化(compactification)得到。所以一时之间,很多人认为11维超引力就是终极理论了。霍金曾说,基于谨慎乐观的态度,有理由相信,一个完备的理论已经逐渐成形,理论物理快到头了。
超引力与超对称场论一样,紫外发散比没有超对称时来得轻得多。超对称的数目越多,紫外行为越好。在任何一个4维超引力中,单圈和双圈图都是有限的,这个性质在超引力出现一年之后就被发现。虽然紫外发散要在三圈才出现,在超引力时代还没有人敢计算三圈图(想一想,经典作用量已经那么复杂!),很久以后才有人计算三圈图,而用到的技巧居然是弦论中的技巧。后来的结果表明,极大超引力的两圈图直到6维都是有限的。也就是说,11维超引力仅仅在单圈才是有限的,所以从重正化的角度看,11维超引力比爱因斯坦的理论好不了多少。之后又有结果表明,4维的极大超引力可能在四圈上也是有限的,这比老结果要好。
无论超引力的紫外行为多么好,或迟或早总要遇到发散,这使得人们渐渐对超引力失去了信心。当然,终结超引力8年疯狂时代的是第一次超弦革命。
我念研究生时恰逢超引力时代的尾巴,已经强烈感受到热力,把研究生仅有的一点经费都用来复印超引力的文章,后来装订成厚厚的几大本,成天把脑袋埋在超引力的张量计算中。我甚至在科大的研究生杂志上写过一篇介绍超引力的文章,开头用了“上帝说要有光,于是就有了光”,可见信心十足。
超引力造就了一代不畏冗长计算的人。超引力的三位创始人都是天然计算机。以范纽文豪生为例,当时他是领导潮流的人。美国超弦的公众人物之一加来道雄(M.Kaku)在他的科普作品《超空间》(Hyperspace)中有一段描写,不妨转述如下:范纽文豪生生得高大威猛,最适合做防晒油的广告明星。研究超引力需要非凡的耐心,而范纽文豪生是最非凡的一个。温伯格曾说:“看一看超引力,在过去的十年中研究超引力的人个个杰出,有些人比我年轻时认识的任何人都更为杰出。”范纽文豪生用一个硕大无朋的夹纸板,每次演算,从左上角开始用蝇头小草一直写到右下角,写满后翻过一页接着写。他可以一直这样演算下去,中间唯一的间隙用来将铅笔放进电动削笔刀中削尖,接着继续演算,直到数小时后大功告成。有一段时间,纽约州立大学石溪分校物理系的研究生竞相仿效,每人夹着一个大夹纸板在校园中走来走去,不可一世。
超引力风流一时,而超引力中的领袖人物也领导潮流于一时。超引力在我们的史话中还会出现,还在起很大的作用。尽管如此,过去的风流人物大多已不再活跃,不免使人生出许多感慨:江山代有人才出,各领风骚三五年。
话虽这么说,前两年超引力又回来了,因为有人猜测N=8泛超引力也许真的是有限的,也就是说,不需要重正化,还真可能应了很多年前霍金的想法。只是,很多人认为即使泛超引力是有限的,它也不可能是完整的理论,因为里面含有弦啊什么的。但是,最后的结果又有谁知道呢?上帝总有意想不到的东西藏在口袋里。