瑞利男爵(Lord Rayleigh)是物理学界的巨人,好几个自然定律都是以他的名字命名的。瑞利散射定律解答了一个著名的问题:天空为什么是蓝色的?他因此在学术圈外也享有盛誉。1886年,作为一位受人尊敬的大科学家,他向英国科学促进协会递交了一篇有关几个电动力学悖论的论文,却很快被拒稿了,理由是该论文的内容相关性和质量没有达到期刊的标准。然而,编辑们很快就改变了主意。这并非因为论文本身有什么改动,而是由于第一次投稿时,瑞利的名字无意中被漏掉了。当编辑们明白这是瑞利的大作时,马上就接收了它,并且还向瑞利连连致歉 59 , 60 。换句话说,最初被视为某位“悖论发现者”所写的不成熟的文章,一旦被证明出自一位享誉世界的科学家之手,突然就有了发表价值。
这则趣闻凸显了一个在科学界至关重要的信号传递机制:科学声誉的作用。根据《圣经·马太福音》的一节,罗伯特·K.默顿(Robert K. Merton)在1968年将此现象称作马太效应 60 。书中这样比喻才能:凡有的,还要加给他,叫他有余;凡没有的,连他所有的也要夺去。过去几十年,多个学科各自都发现了马太效应这一现象。第17章在讨论引用时还会提及这个概念。就职业发展而言,马太效应其实表明,科学家的地位和声誉本身就能带来额外的关注和认可。这也意味着,地位不仅影响着科学界对科学家信誉的认知以及对其工作成果的评价,而且还可以转换为有形资产,无论是获得科研经费,还是能接触到杰出的学生和同事,这一切都能进一步提升拥有地位者的声誉。我们将在本章剖析马太效应在职业发展过程中的作用。
互联网工程任务组(IETF)是一个开发互联网运行协议的计算机工程师与科学家社团。为保证质量和功能性,工程师们必须将所有新协议以初稿的形式提交,并通过严格的同行评审。有一段时间,每份稿件都会列出全部作者的姓名。但在1999年初,一些初稿会将作者的完整名单替换为“某某等”(et al.)这种带有缩略语的一般形式,对评审委员会隐去了一些作者的姓名。
使用“et al.”标签隐去著名作者与不知名作者,通过比较这两种情况,研究人员对瑞利男爵的经历进行了一次真实有效的实验 61 。他们发现,如果提交的稿件上出现一个显赫的名字,比如某个工作组的主席(这一般标志着某个人的专业地位),那么该稿件得以发表的可能性将提高9.4%。但是,当资深作者的名字被“et al.”遮盖时,“主席效应”将下降7.2%。换言之,如果有一位资深作者是稿件的共同作者,那么这种情况所带来的好处,有77%源自姓名的信号传递效应。
有趣的是,当将这一分析限定在部分经过“预先筛选”或严格审查的稿件上时,作者姓名的溢出效应便消失了。这表明,只有当审稿人面对大量投稿时,地位效应才存在。换句话说,当评审者真正读了稿件,并对内容进行仔细评判,地位信号就会逐渐消失。
随着科学体量的爆发式增长,我们常常遇到稿件“多得读不过来”的局面。而同行评审通常又是一个极其复杂的过程,作者和评审专家要经过许多轮的交流,这意味着地位信号对于科研稿件来说,可能不是那么令人担忧的因素,对工作的客观评价有望通过对论文的不断反驳和修改而实现。但是,就像我们会在下面见到的那样,地位效应很难根除。
作者的地位是否会影响人们对其论文质量的感知,这一直是科学界争论的话题。要真正评估地位的作用,我们需要随机的对照实验:同一篇初稿要经历两次独立的评审,一次显露作者的身份,而另一次则将其隐藏。由于显而易见的道德和组织管理上的种种原因,这样的实验难以付诸实践。但在2017年,谷歌的一组研究人员受邀成为第10届美国计算机协会“网络搜索与数据挖掘”(WSDM)国际会议程序委员会的共同主席。这是一个高标准的计算机学术会议,论文接受率仅为15.6%。这些研究人员决定借此契机来评估地位在论文接受与否中的重要作用 62 。
同行评审有很多方式。最常见的是“单盲”(single-blind)评审,即评审者完全清楚作者的身份及其所属机构或公司,但论文作者却不知道评审者的身份。与此相对的是“双盲”(double-blind)评审,即论文作者及评审者都不知道对方的身份。在2017年的WSDM大会上,程序委员会的评审者被随机划分到单盲组和双盲组。每篇论文指派4位评审者,两人来自单盲组,另外两人来自双盲组。换言之,每篇论文由两组评审者独立审查,其中一组评审者知道作者是谁,而另一组不知道。
通过瑞利男爵的例子,结果可想而知:那些知名作者,即在此前的WSDM大会上至少发表过3篇论文,同时迄今为止在计算机科学领域共发表过超过100篇论文的作者,他们在单盲组的论文接受率,比在双盲组高了63%。这两个组评审的论文完全相同,因此接受率上的差别只能用作者的身份来解释。同样,来自顶尖大学的作者,一旦他们与大学的隶属关系被评审者所知,其论文接受率也会增加58%。此外,在谷歌、脸书(Facebook)或微软等在计算机科学领域声誉卓著的机构工作的作者,其论文的接受率增加了110%。
这些结果表明,在科学界,当评判一篇科研论文时,人们确实信赖声誉,看重作者的地位和研究机构的声望。尽管这种信息的使用对于决策制定的影响是好是坏仍有争议,但地位信号却仍是论文在某些著名的场合得以发表的关键因素。
科学的真相
The Science of Science
双盲法与单盲法
如果两篇论文内容非常接近,其中一篇出自不知名的科研人员,而另一篇出自相当有声望的研究者,它们显然应该有相同的发表机会,但这只有在采用双盲法评审时才有可能发生。这难道不是科学界应全部采用双盲评审的有力理由吗?然而,新的证据表明,这一简单的问题可能并不容易解决。
《自然》杂志进行的一项实验表明,如果双盲评审是非强制性的,那么这一问题并不能得以解决 63 。《自然》在2015年开始提供双盲评审选项。分析了从2015年3月至2017年2月期间《自然》名下25种期刊的所有论文,研究人员发现,通讯作者来自名望稍逊的研究机构时,更有可能选择双盲评审,其原因可能是试图纠正已有的偏见。但无论是初审还是同行评审,采用双盲评审时论文的通过率都明显低于单盲评审。
以《自然》这一旗舰刊物为例,在单盲评审程序下,论文送审的概率是23%。但如果你选择双盲评审,这个概率将下降到8%。论文进入评审环节以后,这一情况也没有改进:单盲评审的论文接受率大约为44%,而双盲评审的论文接受率仅为25%。换句话说,评审者在不知道作者身份的情况下,会更挑剔。这些差别非常重要:如果将论文送审的概率与评审后得以接受的概率相乘,论文经双盲评审程序后能被《自然》所接受的概率是2%,真令人难以置信。单盲评审尽管希望依然不大,但成功率仍有10.1%。换言之,仅仅因为选择了双盲评审,论文的接受率一下子就变成了原来的1/5。
对于这个明显的差异,一种解释是论文质量的差异 63 。的确,如果作者不那么知名或者来自名声不是那么响亮的研究机构,那么比起经验丰富或来自卓越机构的作者,两者的论文在学术水准上可能并不一致。但是,很有影响力的经济学领域期刊《美国经济评论》( The American Economic Review )所做的一次随机试验反驳了这一论点 64 。从1987年5月至1989年5月,《美国经济评论》对提交的论文进行随机试验,一半论文被指定采用双盲评审,另一半采取单盲评审。由于选择方式随机,所以这两组论文的总体质量没有差别。但是,双盲评审组的论文接受率仍然低了不少。
这些结果表明,积极歧视(positive discrimination)可能是这一现象更恰当的解释:地位已知的作者容易受到“姑且信之”态度的纵容,而没有地位的那些人,无论在研究设计还是研究方法上都要经历更严格的审查。然而,人们仍然很难找到客观的理由来解释为何双盲评审不能成为科学出版的评审标准。它的广泛应用将创造公平的竞争环境,降低地位对作者的影响,无论这种地位是来自其先前成果的影响力,还是仅仅来自其隶属的某个声名显赫的研究机构。
科学家的声望有助于论文的顺利发表,但这会不会提高他们科研成果的长期影响力呢?论文只需要评审者们一时达成肯定的共识就能被接收,但它的影响力却取决于科学界更广泛的认可,人们也许会在该成果的基础上展开更深入的研究,也可能会忽略它。著名科学家发表的论文是否也享受到了影响力的红利呢?
声誉该如何测量呢?或许应该先考虑一下 C i ( t ),它相当于在新论文发表前,作者所有已发表论文的总引用量 65 , 66 。实际上, C i ( t )结合了产出量(作者所发表的论文数)和影响力(这些论文被其他作者引用的频率)这两个因素,而这种结合基本上就可以代表作者在其研究领域里的认可程度。
一篇论文获得新引用的速度,往往与这篇论文已获得的引用量成正比 67 , 68 。高被引论文阅读量更高,因此也更有可能被再次引用。这种现象被称作优先连接(preferential attachment),我们将在第17章对此进一步讨论。要明白作者的声誉对发表的论文有什么影响,我们可以测量著名作者的论文在发表早期的引用红利 65 。例如,对一组著名物理学家而言,优先连接在论文获得约40条引用之后才显现( C x ≈40)(见图3-1)。与此形成对照的是,对于物理学界的年轻科学家(比如副教授), C x 从40降到了10。也就是说,论文一经发表,资深作者的论文被引用的可能性是年轻作者的4倍 (14) 。
图3-1 声誉对引用的交叉效应
线性附着率在 C ﹤ C x 时不再成立,表明有额外的因素助推引用的增长,使 C ( t )得以抬升,偏离了完全由优先连接机制所预测的趋势。数据集包括100名具有最高引用量的物理学家以及100名最多产的物理学家 65 。
图3-1表明,在引用量还较小的早期(当 C ﹤ C x ),声誉起着重要的作用。但随着时间的推移,声誉效应也逐渐减退,论文的长期影响力主要还是取决于论文的内在特质,而不是论文的作者。换言之,著名学者享受了早期的引用优势,他们的研究更容易被科学界关注,对早期的引用也有所裨益。但这种声誉效应随着时间的推移而逐渐消失,优先连接会取而代之,最终使得引用率主要取决于科学界同仁对成果内在价值的集体认知。
以上所讨论的声誉提升并不局限于新发表的论文,声誉还可能使早期的研究成果产生溢出效应,提升它们的影响力。像获得诺贝尔奖这样突如其来的认可,让我们可以量化这种效应。以约翰·芬恩为例,他因为发明了电喷雾离子化技术而获得2002年诺贝尔化学奖。这一发现于1989年发表在《科学》杂志上,也是他引用量最高的论文 69 。根据谷歌学术统计,截至2018年,该文共获得近8 500次引用。当这一里程碑式的论文发表后,它便以罕见的速度积累着引用量,而芬恩的几篇早期论文的引用量也开始迅速增加。针对124名诺贝尔奖获得者的分析表明,这种提升带有普遍性 70 :一项重要科学发现的公布也连带增加了作者以前发表的论文的引用量。有趣的是,那些引用量提升的早期论文与新发现的课题并不一定相关。也就是说,声誉信号通过将对专业关注引向个人而产生作用。结果,当学者在某一科学领域突然声名显赫时,他的声誉也可能会延伸到研究工作的其他方面,即使是不相关的领域。
科学的真相
The Science of Science
从升到降:反转的马太效应
一项突破性成就有利于科学家过去和未来的学术研究,一项丑闻对他的职业发展会带来什么影响呢?科学家肯定是会犯错的,严重错误和学术不端的事件也经常会在科学界出现。这些事件会导致论文被撤稿,特别是涉及审查严格的顶级期刊时 71 。撤稿在多大程度上影响科学家的职业发展?比起年轻的同事,声名卓著的作者所受到的负面影响是更严重还是更轻微?尽管论文撤稿有助于其他研究人员规避错误假设,对科学自身大有裨益,但对撤稿论文的作者来说绝非好事:他们也会经历一种溢出效应,这会给其先前取得的整体科研成果的引用量造成损害 72-74 。但这种负面影响并不是同等施加的:有名望的科学家因论文撤稿所受到的惩罚,比起不那么出名的同事而言要更加严厉 74 。不过,关键在于这一结论只适用于撤稿涉及学术欺诈或不端时。换句话说,当论文撤稿被认为是由于“无心之过”,作者地位所导致的惩罚差异性就会消失 74 。
但是,当资深学者和年轻科学家的署名同时出现在一篇被撤的论文上时,他们所受到的惩罚却会因地位不同而迥异 75 :资深学者往往会逃过一劫,而年轻的合作者则承担了多数责任,有时他们甚至可能因此提前退出科研领域。我们在第13章探讨合作研究的利弊时,会再讨论这一效应。
很多伟大的科学家都拥有不止一项突破性成就 60 , 76 。牛顿就是一个典型的例子,除了牛顿力学,他还创立了万有引力理论、微积分、牛顿运动定律、光学,还有最优化理论。事实上,著名科学家往往会涉及多项科研发现,这种现象也可以用马太效应来解释。初始的成功可能会使科学家备受认可,改善同事对他的看法,获得在竞争中赢得优势并最终取胜的经验,提高社会地位以及吸纳各种资源和优秀的合作者,这每一项回报都增加了其下次成功的可能性。但是,另一种解释也同样有趣:那些伟大的科学家只是因为超常的天赋,才能在科研事业中取得多项轰动性发现,并不断地获得成功。因此,未来的成功仍属于先前已经取得成功的那些人,并非是以前的成功给他们创造了有利条件,而是因为以前的成功验证了他们的潜在天赋。而根据马太效应,仅仅是成功本身就能增加未来成功的可能性。这就引发了一个问题:地位决定了结果,还是反映了潜在的杰出天赋或素质?换句话说,马太效应真的存在吗?
如果结果是相同的,我们为什么还要纠结哪一种解释更合理呢?不管在哪种机制下,那些先前已经获得成功的人,在将来都更有可能成功。但是,如果一些人能成功而其他人不能成功的唯一原因是天赋上的差别,那就意味着命运从一开始就青睐某些人,同时又忽视了其他人。然而,如果马太效应是真实存在的,那么你所经历的每一次成功,都将为下一次成功创造更好的机遇。你可能不是爱因斯坦,但是如果能幸运地赢得先机,你就有可能缩小自己与大师之间的差距,因为成功会像滚雪球一样越来越大。
可惜,要区别这两种相互冲突的理论相当困难,因为它们产生的经验观测结果非常相似。对这两种相互对立的假设所做的一项测试,源于法兰西学院神奇的“第41把交椅”。学院最初决定只设置40个席位,将它的成员数限制在40人,称其为“不朽者”。只有当某位成员去世,席位出现空缺,才会考虑新成员的提名或者申请。在这一限制条件下,许多实至名归的个人从未入选该学院,永远安坐在第41把交椅上。该席位上挤满了很多真正的不朽者,这些人包括笛卡尔、帕斯卡、莫里哀、卢梭、圣西门、狄德罗、司汤达、福楼拜、左拉和普鲁斯特等 60 。而可悲的是,许多在这间受人尊敬的俱乐部里占有一席之地的人却不为人知。随着时间的推移,第41把交椅成了一个符号,代表着许多才华横溢的科学家。他们作为各自领域的巨人,本来应该获得正式的认可,却从来没有得到过。
但是,获得正式认可与否真的重要吗?那些重要奖项的获奖者以及与其成就相近却从未获得正式认可的科学家,大众对这两种人的看法有何差异?换句话说,坐在第41把交椅上的那些人,如果入选了法兰西学院,他们的职业发展会有不同吗?有一项研究探究了提升学术地位的大奖的影响力,为这一问题提供了答案 77 。
霍华德·休斯医学研究所(Howard Hughes Medical Institute,HHMI)是美国生物医学研究领域久负盛名的私人基金组织,他们看中的是“人,而不是项目”,慷慨地支持科学家,而不是资助基于同行评审的特定研究提案。该研究所每年大概会为每位研究者提供100万美元的资金,其资助具有长期性与灵活性,允许受资助人按照自己的意愿自由研究,必要时还可改变研究方向。除了资金上的自由,成为HHMI研究员还被视为一项声名显赫的荣誉。要想度量HHMI奖金的影响力,关键在于如何建立一个对照组,其中的科学家与HHMI的研究人员水平相近,却没有获得奖金,然后再对两组人员的研究成果进行比较。
假设确定了对照组的人选,而且确实有证据表明HHMI的研究员具有更大影响力,那么我们又如何确定这种差别是不是纯粹由他们新近获得的地位所致?毕竟,每年100万美元的项目资金,能够带来丰富的资源,可以更好地进行科研工作。要解决这个问题,我们可以只关注他们在获得HHMI奖金之前所写的论文。如此一来,两组人员在论文引用量上的差异就不能简单地归结为更优厚的资源了。果然,分析显示科学家在获得HHMI研究员任命后,其早期论文的引用率有明显增长,这证明了在科学界声誉高低确实影响着职业的发展。
这种“成功孕育成功”的效应并不局限于HHMI研究员。当一位科学家成为诺贝尔奖获得者,他先前发表的论文,无论能否达到诺贝尔奖水准,都会赢得更多关注 78 。同样,就像前面提到的约翰·芬恩的例子一样,一个人无论成了HHMI研究员,还是荣膺诺贝尔桂冠,他以前的研究成果都不会改变。但在新荣誉的加持下,这些研究成果受到的关注却增加了。
然而有趣的是,严格的对照实验表明,地位对影响力的作用还不算太大,仅限于一个短暂的窗口期。当论文质量还不确定以及获奖者在获奖时地位相对较低的情况下,获奖所带来的影响明显更大,这一点与马太效应的理论是一致的。总之,这些结果显示:一方面,在判断地位对学术表现的影响上,常规研究可能夸大了其真正的影响力;另一方面,声名卓著的科学家,其科研产出确实能够获得更大的认可,从而进一步支持了马太效应理论。
科学的真相
The Science of Science
马太效应具有因果关系的证据:实地实验
随机实验可以极好地将地位的作用与天赋等个体差异进行隔离。我们可以选择两个组(对照组和实验组),然后赋予实验组随机的有利条件,而忽略对照组。如果不根据各人先前的成功经历或地位对有利条件进行分配,那么随后获得有利条件的那一组比未获得的那一组所表现出的差异,只能归结为前者在实验初期获得的由外部分配的有利条件。
虽然我们不能将改变人生的大奖或项目资金授予随机选择的科研人员,却能够通过在真实环境下的实验来探讨这一现象,使干预的损害减至最小 79 。这也正是阿尔纳特·范·德·瑞杰(Arnout Van De Rijt)和他的同事们在一系列实验中所采取的手段 80 , 81 。在位居前1%的维基百科编辑中,他们随机选择了一些最多产的贡献者,并随机地将这些贡献者分为两组,然后给实验组颁发冒牌的“维基星章”。这种奖章是维基百科社区对杰出编辑们予以认可的奖励。就像图3-2所显示的那样,由于他们都是从同样多产的编辑样本中随机选取的,两个组的活跃度在干预之前难分伯仲。然而,当冒牌的维基星章被授予实验组之后,获奖者展示出比对照组成员更积极的参与度,他们的产出率更加稳定,退出编辑活动的概率也降低了。事实上,与对照组相比,收到维基星章使实验组的平均产出率增加了60%。更重要的是,他们还继续从其他编辑那里额外获得了真正的维基星章。这些额外奖励并非仅仅是由于产出率的提升,因为实验组内收到额外奖励的个人并不比没有收到额外奖励的个人更活跃。这种能够观察到的“成功孕育成功”现象,被证明持续存在于众筹、社会地位、商业背书以及声誉等诸多领域 81 。这表明初始的赞助,即使是随意的,也能够在个人成功方面带来持久的差别,进而通过具有因果关系的证据证明了马太效应的存在。
图3-2 马太效应——来自实地实验的证据
研究人员将维基编辑们随机分为两组,给实验组颁发维基星章,而不为对照组颁发星章。圆圈显示被区别对待后编辑们收到额外的真正奖励的时间。实验组有12位被试总共收到14个奖励,而对照组只有2位被试总共收到3个奖励 80 。