瑞利男爵(Lord Rayleigh)是物理学界的巨人,好几个自然定律都是以他的名字命名的。瑞利散射定律解答了一个著名的问题:天空为什么是蓝色的?他因此在学术圈外也享有盛誉。1886年,作为一位受人尊敬的大科学家,他向英国科学促进协会递交了一篇有关几个电动力学悖论的论文,却很快被拒稿了,理由是该论文的内容相关性和质量没有达到期刊的标准。然而,编辑们很快就改变了主意。这并非因为论文本身有什么改动,而是由于第一次投稿时,瑞利的名字无意中被漏掉了。当编辑们明白这是瑞利的大作时,马上就接收了它,并且还向瑞利连连致歉 [59] , [60] 。换句话说,最初被视为某位“悖论发现者”所写的不成熟的文章,一旦被证明出自一位享誉世界的科学家之手,突然就有了发表价值。
这则趣闻凸显了一个在科学界至关重要的信号传递机制:科学声誉的作用。根据《圣经·马太福音》的一节,罗伯特·K.默顿(Robert K. Merton)在1968年将此现象称作马太效应 [60] 。书中这样比喻才能:凡有的,还要加给他,叫他有余;凡没有的,连他所有的也要夺去。过去几十年,多个学科各自都发现了马太效应这一现象。第17章在讨论引用时还会提及这个概念。就职业发展而言,马太效应其实表明,科学家的地位和声誉本身就能带来额外的关注和认可。这也意味着,地位不仅影响着科学界对科学家信誉的认知以及对其工作成果的评价,而且还可以转换为有形资产,无论是获得科研经费,还是能接触到杰出的学生和同事,这一切都能进一步提升拥有地位者的声誉。我们将在本章剖析马太效应在职业发展过程中的作用。
互联网工程任务组(IETF)是一个开发互联网运行协议的计算机工程师与科学家社团。为保证质量和功能性,工程师们必须将所有新协议以初稿的形式提交,并通过严格的同行评审。有一段时间,每份稿件都会列出全部作者的姓名。但在1999年初,一些初稿会将作者的完整名单替换为“某某等”(et al.)这种带有缩略语的一般形式,对评审委员会隐去了一些作者的姓名。
使用“et al.”标签隐去著名作者与不知名作者,通过比较这两种情况,研究人员对瑞利男爵的经历进行了一次真实有效的实验 [61] 。他们发现,如果提交的稿件上出现一个显赫的名字,比如某个工作组的主席(这一般标志着某个人的专业地位),那么该稿件得以发表的可能性将提高9.4%。但是,当资深作者的名字被“et al.”遮盖时,“主席效应”将下降7.2%。换言之,如果有一位资深作者是稿件的共同作者,那么这种情况所带来的好处,有77%源自姓名的信号传递效应。
有趣的是,当将这一分析限定在部分经过“预先筛选”或严格审查的稿件上时,作者姓名的溢出效应便消失了。这表明,只有当审稿人面对大量投稿时,地位效应才存在。换句话说,当评审者真正读了稿件,并对内容进行仔细评判,地位信号就会逐渐消失。
随着科学体量的爆发式增长,我们常常遇到稿件“多得读不过来”的局面。而同行评审通常又是一个极其复杂的过程,作者和评审专家要经过许多轮的交流,这意味着地位信号对于科研稿件来说,可能不是那么令人担忧的因素,对工作的客观评价有望通过对论文的不断反驳和修改而实现。但是,就像我们会在下面见到的那样,地位效应很难根除。
作者的地位是否会影响人们对其论文质量的感知,这一直是科学界争论的话题。要真正评估地位的作用,我们需要随机的对照实验:同一篇初稿要经历两次独立的评审,一次显露作者的身份,而另一次则将其隐藏。由于显而易见的道德和组织管理上的种种原因,这样的实验难以付诸实践。但在2017年,谷歌的一组研究人员受邀成为第10届美国计算机协会“网络搜索与数据挖掘”(WSDM)国际会议程序委员会的共同主席。这是一个高标准的计算机学术会议,论文接受率仅为15.6%。这些研究人员决定借此契机来评估地位在论文接受与否中的重要作用 [62] 。
同行评审有很多方式。最常见的是“单盲”(single-blind)评审,即评审者完全清楚作者的身份及其所属机构或公司,但论文作者却不知道评审者的身份。与此相对的是“双盲”(double-blind)评审,即论文作者及评审者都不知道对方的身份。在2017年的WSDM大会上,程序委员会的评审者被随机划分到单盲组和双盲组。每篇论文指派4位评审者,两人来自单盲组,另外两人来自双盲组。换言之,每篇论文由两组评审者独立审查,其中一组评审者知道作者是谁,而另一组不知道。
通过瑞利男爵的例子,结果可想而知:那些知名作者,即在此前的WSDM大会上至少发表过3篇论文,同时迄今为止在计算机科学领域共发表过超过100篇论文的作者,他们在单盲组的论文接受率,比在双盲组高了63%。这两个组评审的论文完全相同,因此接受率上的差别只能用作者的身份来解释。同样,来自顶尖大学的作者,一旦他们与大学的隶属关系被评审者所知,其论文接受率也会增加58%。此外,在谷歌、脸书(Facebook)或微软等在计算机科学领域声誉卓著的机构工作的作者,其论文的接受率增加了110%。
这些结果表明,在科学界,当评判一篇科研论文时,人们确实信赖声誉,看重作者的地位和研究机构的声望。尽管这种信息的使用对于决策制定的影响是好是坏仍有争议,但地位信号却仍是论文在某些著名的场合得以发表的关键因素。
如果两篇论文内容非常接近,其中一篇出自不知名的科研人员,而另一篇出自相当有声望的研究者,它们显然应该有相同的发表机会,但这只有在采用双盲法评审时才有可能发生。这难道不是科学界应全部采用双盲评审的有力理由吗?然而,新的证据表明,这一简单的问题可能并不容易解决。
《自然》杂志进行的一项实验表明,如果双盲评审是非强制性的,那么这一问题并不能得以解决 [63] 。《自然》在2015年开始提供双盲评审选项。分析了从2015年3月至2017年2月期间《自然》名下25种期刊的所有论文,研究人员发现,通讯作者来自名望稍逊的研究机构时,更有可能选择双盲评审,其原因可能是试图纠正已有的偏见。但无论是初审还是同行评审,采用双盲评审时论文的通过率都明显低于单盲评审。
以《自然》这一旗舰刊物为例,在单盲评审程序下,论文送审的概率是23%。但如果你选择双盲评审,这个概率将下降到8%。论文进入评审环节以后,这一情况也没有改进:单盲评审的论文接受率大约为44%,而双盲评审的论文接受率仅为25%。换句话说,评审者在不知道作者身份的情况下,会更挑剔。这些差别非常重要:如果将论文送审的概率与评审后得以接受的概率相乘,论文经双盲评审程序后能被《自然》所接受的概率是2%,真令人难以置信。单盲评审尽管希望依然不大,但成功率仍有10.1%。换言之,仅仅因为选择了双盲评审,论文的接受率一下子就变成了原来的1/5。
对于这个明显的差异,一种解释是论文质量的差异 [63] 。的确,如果作者不那么知名或者来自名声不是那么响亮的研究机构,那么比起经验丰富或来自卓越机构的作者,两者的论文在学术水准上可能并不一致。但是,很有影响力的经济学领域期刊《美国经济评论》( The American Economic Review )所做的一次随机试验反驳了这一论点 [64] 。从1987年5月至1989年5月,《美国经济评论》对提交的论文进行随机试验,一半论文被指定采用双盲评审,另一半采取单盲评审。由于选择方式随机,所以这两组论文的总体质量没有差别。但是,双盲评审组的论文接受率仍然低了不少。
这些结果表明,积极歧视(positive discrimination)可能是这一现象更恰当的解释:地位已知的作者容易受到“姑且信之”态度的纵容,而没有地位的那些人,无论在研究设计还是研究方法上都要经历更严格的审查。然而,人们仍然很难找到客观的理由来解释为何双盲评审不能成为科学出版的评审标准。它的广泛应用将创造公平的竞争环境,降低地位对作者的影响,无论这种地位是来自其先前成果的影响力,还是仅仅来自其隶属的某个声名显赫的研究机构。
科学家的声望有助于论文的顺利发表,但这会不会提高他们科研成果的长期影响力呢?论文只需要评审者们一时达成肯定的共识就能被接收,但它的影响力却取决于科学界更广泛的认可,人们也许会在该成果的基础上展开更深入的研究,也可能会忽略它。著名科学家发表的论文是否也享受到了影响力的红利呢?
声誉该如何测量呢?或许应该先考虑一下 C i ( t ),它相当于在新论文发表前,作者所有已发表论文的总引用量 [65] , [66] 。实际上, C i ( t )结合了产出量(作者所发表的论文数)和影响力(这些论文被其他作者引用的频率)这两个因素,而这种结合基本上就可以代表作者在其研究领域里的认可程度。
一篇论文获得新引用的速度,往往与这篇论文已获得的引用量成正比 [67] , [68] 。高被引论文阅读量更高,因此也更有可能被再次引用。这种现象被称作优先连接(preferential attachment),我们将在第17章对此进一步讨论。要明白作者的声誉对发表的论文有什么影响,我们可以测量著名作者的论文在发表早期的引用红利 [65] 。例如,对一组著名物理学家而言,优先连接在论文获得约40条引用之后才显现( C x ≈40)(见图3-1)。与此形成对照的是,对于物理学界的年轻科学家(比如副教授), C x 从40降到了10。也就是说,论文一经发表,资深作者的论文被引用的可能性是年轻作者的4倍 (14) 。
图3-1 声誉对引用的交叉效应
线性附着率在
C
﹤
C
x
时不再成立,表明有额外的因素助推引用的增长,使
C
(
t
)得以抬升,偏离了完全由优先连接机制所预测的趋势。数据集包括100名具有最高引用量的物理学家以及100名最多产的物理学家
[65]
。
图3-1表明,在引用量还较小的早期(当 C ﹤ C x ),声誉起着重要的作用。但随着时间的推移,声誉效应也逐渐减退,论文的长期影响力主要还是取决于论文的内在特质,而不是论文的作者。换言之,著名学者享受了早期的引用优势,他们的研究更容易被科学界关注,对早期的引用也有所裨益。但这种声誉效应随着时间的推移而逐渐消失,优先连接会取而代之,最终使得引用率主要取决于科学界同仁对成果内在价值的集体认知。
以上所讨论的声誉提升并不局限于新发表的论文,声誉还可能使早期的研究成果产生溢出效应,提升它们的影响力。像获得诺贝尔奖这样突如其来的认可,让我们可以量化这种效应。以约翰·芬恩为例,他因为发明了电喷雾离子化技术而获得2002年诺贝尔化学奖。这一发现于1989年发表在《科学》杂志上,也是他引用量最高的论文 [69] 。根据谷歌学术统计,截至2018年,该文共获得近8 500次引用。当这一里程碑式的论文发表后,它便以罕见的速度积累着引用量,而芬恩的几篇早期论文的引用量也开始迅速增加。针对124名诺贝尔奖获得者的分析表明,这种提升带有普遍性 [70] :一项重要科学发现的公布也连带增加了作者以前发表的论文的引用量。有趣的是,那些引用量提升的早期论文与新发现的课题并不一定相关。也就是说,声誉信号通过将对专业关注引向个人而产生作用。结果,当学者在某一科学领域突然声名显赫时,他的声誉也可能会延伸到研究工作的其他方面,即使是不相关的领域。
一项突破性成就有利于科学家过去和未来的学术研究,一项丑闻对他的职业发展会带来什么影响呢?科学家肯定是会犯错的,严重错误和学术不端的事件也经常会在科学界出现。这些事件会导致论文被撤稿,特别是涉及审查严格的顶级期刊时 [71] 。撤稿在多大程度上影响科学家的职业发展?比起年轻的同事,声名卓著的作者所受到的负面影响是更严重还是更轻微?尽管论文撤稿有助于其他研究人员规避错误假设,对科学自身大有裨益,但对撤稿论文的作者来说绝非好事:他们也会经历一种溢出效应,这会给其先前取得的整体科研成果的引用量造成损害 [72]-[74] 。但这种负面影响并不是同等施加的:有名望的科学家因论文撤稿所受到的惩罚,比起不那么出名的同事而言要更加严厉 [74] 。不过,关键在于这一结论只适用于撤稿涉及学术欺诈或不端时。换句话说,当论文撤稿被认为是由于“无心之过”,作者地位所导致的惩罚差异性就会消失 [74] 。
但是,当资深学者和年轻科学家的署名同时出现在一篇被撤的论文上时,他们所受到的惩罚却会因地位不同而迥异 [75] :资深学者往往会逃过一劫,而年轻的合作者则承担了多数责任,有时他们甚至可能因此提前退出科研领域。我们在第13章探讨合作研究的利弊时,会再讨论这一效应。
很多伟大的科学家都拥有不止一项突破性成就 [60] , [76] 。牛顿就是一个典型的例子,除了牛顿力学,他还创立了万有引力理论、微积分、牛顿运动定律、光学,还有最优化理论。事实上,著名科学家往往会涉及多项科研发现,这种现象也可以用马太效应来解释。初始的成功可能会使科学家备受认可,改善同事对他的看法,获得在竞争中赢得优势并最终取胜的经验,提高社会地位以及吸纳各种资源和优秀的合作者,这每一项回报都增加了其下次成功的可能性。但是,另一种解释也同样有趣:那些伟大的科学家只是因为超常的天赋,才能在科研事业中取得多项轰动性发现,并不断地获得成功。因此,未来的成功仍属于先前已经取得成功的那些人,并非是以前的成功给他们创造了有利条件,而是因为以前的成功验证了他们的潜在天赋。而根据马太效应,仅仅是成功本身就能增加未来成功的可能性。这就引发了一个问题:地位决定了结果,还是反映了潜在的杰出天赋或素质?换句话说,马太效应真的存在吗?
如果结果是相同的,我们为什么还要纠结哪一种解释更合理呢?不管在哪种机制下,那些先前已经获得成功的人,在将来都更有可能成功。但是,如果一些人能成功而其他人不能成功的唯一原因是天赋上的差别,那就意味着命运从一开始就青睐某些人,同时又忽视了其他人。然而,如果马太效应是真实存在的,那么你所经历的每一次成功,都将为下一次成功创造更好的机遇。你可能不是爱因斯坦,但是如果能幸运地赢得先机,你就有可能缩小自己与大师之间的差距,因为成功会像滚雪球一样越来越大。
可惜,要区别这两种相互冲突的理论相当困难,因为它们产生的经验观测结果非常相似。对这两种相互对立的假设所做的一项测试,源于法兰西学院神奇的“第41把交椅”。学院最初决定只设置40个席位,将它的成员数限制在40人,称其为“不朽者”。只有当某位成员去世,席位出现空缺,才会考虑新成员的提名或者申请。在这一限制条件下,许多实至名归的个人从未入选该学院,永远安坐在第41把交椅上。该席位上挤满了很多真正的不朽者,这些人包括笛卡尔、帕斯卡、莫里哀、卢梭、圣西门、狄德罗、司汤达、福楼拜、左拉和普鲁斯特等 [60] 。而可悲的是,许多在这间受人尊敬的俱乐部里占有一席之地的人却不为人知。随着时间的推移,第41把交椅成了一个符号,代表着许多才华横溢的科学家。他们作为各自领域的巨人,本来应该获得正式的认可,却从来没有得到过。
但是,获得正式认可与否真的重要吗?那些重要奖项的获奖者以及与其成就相近却从未获得正式认可的科学家,大众对这两种人的看法有何差异?换句话说,坐在第41把交椅上的那些人,如果入选了法兰西学院,他们的职业发展会有不同吗?有一项研究探究了提升学术地位的大奖的影响力,为这一问题提供了答案 [77] 。
霍华德·休斯医学研究所(Howard Hughes Medical Institute,HHMI)是美国生物医学研究领域久负盛名的私人基金组织,他们看中的是“人,而不是项目”,慷慨地支持科学家,而不是资助基于同行评审的特定研究提案。该研究所每年大概会为每位研究者提供100万美元的资金,其资助具有长期性与灵活性,允许受资助人按照自己的意愿自由研究,必要时还可改变研究方向。除了资金上的自由,成为HHMI研究员还被视为一项声名显赫的荣誉。要想度量HHMI奖金的影响力,关键在于如何建立一个对照组,其中的科学家与HHMI的研究人员水平相近,却没有获得奖金,然后再对两组人员的研究成果进行比较。
假设确定了对照组的人选,而且确实有证据表明HHMI的研究员具有更大影响力,那么我们又如何确定这种差别是不是纯粹由他们新近获得的地位所致?毕竟,每年100万美元的项目资金,能够带来丰富的资源,可以更好地进行科研工作。要解决这个问题,我们可以只关注他们在获得HHMI奖金之前所写的论文。如此一来,两组人员在论文引用量上的差异就不能简单地归结为更优厚的资源了。果然,分析显示科学家在获得HHMI研究员任命后,其早期论文的引用率有明显增长,这证明了在科学界声誉高低确实影响着职业的发展。
这种“成功孕育成功”的效应并不局限于HHMI研究员。当一位科学家成为诺贝尔奖获得者,他先前发表的论文,无论能否达到诺贝尔奖水准,都会赢得更多关注 [78] 。同样,就像前面提到的约翰·芬恩的例子一样,一个人无论成了HHMI研究员,还是荣膺诺贝尔桂冠,他以前的研究成果都不会改变。但在新荣誉的加持下,这些研究成果受到的关注却增加了。
然而有趣的是,严格的对照实验表明,地位对影响力的作用还不算太大,仅限于一个短暂的窗口期。当论文质量还不确定以及获奖者在获奖时地位相对较低的情况下,获奖所带来的影响明显更大,这一点与马太效应的理论是一致的。总之,这些结果显示:一方面,在判断地位对学术表现的影响上,常规研究可能夸大了其真正的影响力;另一方面,声名卓著的科学家,其科研产出确实能够获得更大的认可,从而进一步支持了马太效应理论。
随机实验可以极好地将地位的作用与天赋等个体差异进行隔离。我们可以选择两个组(对照组和实验组),然后赋予实验组随机的有利条件,而忽略对照组。如果不根据各人先前的成功经历或地位对有利条件进行分配,那么随后获得有利条件的那一组比未获得的那一组所表现出的差异,只能归结为前者在实验初期获得的由外部分配的有利条件。
虽然我们不能将改变人生的大奖或项目资金授予随机选择的科研人员,却能够通过在真实环境下的实验来探讨这一现象,使干预的损害减至最小 [79] 。这也正是阿尔纳特·范·德·瑞杰(Arnout Van De Rijt)和他的同事们在一系列实验中所采取的手段 [80] , [81] 。在位居前1%的维基百科编辑中,他们随机选择了一些最多产的贡献者,并随机地将这些贡献者分为两组,然后给实验组颁发冒牌的“维基星章”。这种奖章是维基百科社区对杰出编辑们予以认可的奖励。就像图3-2所显示的那样,由于他们都是从同样多产的编辑样本中随机选取的,两个组的活跃度在干预之前难分伯仲。然而,当冒牌的维基星章被授予实验组之后,获奖者展示出比对照组成员更积极的参与度,他们的产出率更加稳定,退出编辑活动的概率也降低了。事实上,与对照组相比,收到维基星章使实验组的平均产出率增加了60%。更重要的是,他们还继续从其他编辑那里额外获得了真正的维基星章。这些额外奖励并非仅仅是由于产出率的提升,因为实验组内收到额外奖励的个人并不比没有收到额外奖励的个人更活跃。这种能够观察到的“成功孕育成功”现象,被证明持续存在于众筹、社会地位、商业背书以及声誉等诸多领域 [81] 。这表明初始的赞助,即使是随意的,也能够在个人成功方面带来持久的差别,进而通过具有因果关系的证据证明了马太效应的存在。
图3-2 马太效应——来自实地实验的证据
研究人员将维基编辑们随机分为两组,给实验组颁发维基星章,而不为对照组颁发星章。圆圈显示被区别对待后编辑们收到额外的真正奖励的时间。实验组有12位被试总共收到14个奖励,而对照组只有2位被试总共收到3个奖励
[80]
。
当伊莱亚斯·泽霍尼(Elias Zerhouni)于2002年被任命为美国国家卫生研究院院长时,他正面对着一场看似棘手的危机:研究院资助的研究人员正以令人担忧的速度逐渐衰老。在1980年,大约18%的R01项目(针对个人最常规的研究资助)的资助者是36岁及以下的青年科学家,年龄在66岁及以上的资深研究人员占比还不到1%。然而,30年之后,情况出现了明显的反转(见图4-1) [82] :2010年,受资助的资深研究人员的人数增加了10倍,而青年研究人员的比例则从18%急剧下降到7%。也就是说,在1980年,美国国家卫生研究院每资助一位资深研究人员的同时,也为18位年轻科学家提供了经费;而到了2010年,获得资助的资深研究人员则是青年研究人员的两倍。泽霍尼声称这种趋势是“美国科学界的头号问题” [83] 。
图4-1 美国科学界的人员老龄化
1980—2010年,在美国国家卫生研究院的R01项目受资助者中,年龄为36岁及以下和66岁及以上两组人员的比例发生的变化
[82]
。
为什么美国国家卫生研究院院长会对这种趋势如此焦虑?毕竟,资深研究人员拥有已被认可的科研记录,知道如何管理项目,也了解各种风险,经验丰富,可以为年轻一代的科学家充当导师。因此,在严格的同行评审下,资深学术带头人往往比初出茅庐的年轻人更容易胜出。纳税人的钱由前者安全地掌管,难道我们不应该更放心吗?
要理解人口结构变化对美国科学界的产出率和显赫地位所构成的威胁,我们需要探讨一个吸引了研究人员几个世纪的问题:科学家在多大年纪时做出他最重大的科学贡献?
对个人年龄和卓越成就之间关系的研究,最早可追溯到1874年。当时,乔治·M.比尔德(George M. Beard)估计,每个人在科学与创造性艺术上的成就巅峰发生于35~40岁 [84] 。之后,哈维·C.莱曼(Harvey C. Lehman)又花了差不多30年时间研究这一问题,并将发现总结在1953年出版的《年龄与成就》( Age and Achievement )这一专著中 [85] 。从那以后,有数十项研究探讨了年龄在一系列创造性领域中的作用,揭示了一个相当稳定的规律:无论对于何种创造性领域,或是成就界定方式,一个人最出彩的成果往往发生在职业生涯的中期,或者说发生在他的30~40岁 [2] , [66] , [85]-[87] 。
图4-2以20世纪的诺贝尔奖得主以及一些卓越的技术创新者的数据为样本,显示出他们做出标志性成就时的年龄分布情况 [88] 。图4-2传达了以下3个关键信息。
图4-2 伟大创新的年龄分布
这幅曲线图结合了20世纪所有的观察结果,显示出创新者做出伟大创新时的年龄
[88]
。
· 年龄的差异很大。虽然很多重大的创新是在他们30多岁完成的(42%),但40多岁完成的占比也很高(30%),还有大约14%的人是在50岁以后才取得了重大突破。
· 没有人在19岁以前获得重大成就。虽然爱因斯坦的“奇迹年”是青春韶华的26岁,牛顿甚至更小,是在23岁,但这个世界上像牛顿、爱因斯坦这样的天才的确太稀少了,因为仅有7%的人在26岁或更早做出了他们最伟大的成就。
· 诺贝尔获奖者和创新者来自两个独立的数据源,两个名单之间仅有7%的重叠。但这两组样本的年龄分布惊人地相似。
综上所述,图4-2显示了科学成就的巅峰出现在中年 [2] , [66] , [85]-[87] 。科学家的职业周期一般始于学习,这时他们通常没有重大的创新成果。随后迎来创造性产出的快速跃升期,巅峰期在30岁后期或40岁,最后随着他们进入晚年而缓慢下降。这种规律相当普遍。研究人员以各种不同方式对科学家进行考察,通过是否获得诺贝尔奖、是否收入百科全书以及是否在英国皇家学会或美国国家科学院这类组织里有一席之地,进而确定那些重要的科学家。无论怎样切分数据,得到的模式基本与图4-2相同。这就引发了两个问题:为什么在20岁和30岁早期,创造性会与我们保持距离?为什么在我们的晚年它会衰减?
科研人员职业发展的一个显著特征是在初始阶段没有什么贡献 [89] 。简单地说,没有哪位科研人员能在18岁时做出够得上诺贝尔奖水平的成果。职业生涯的早期与学校教育的时间重合,这意味着对于教育的需求可能是科研人员早期没有优秀成果的原因。这也和创造力理论一致,“创造力”通常被界定为对已有的知识进行有趣组合的能力 [90]-[92] 。如果我们将知识视为一块块的乐高积木,新的发明和创意则取决于能否找出崭新的方式来组合这些组件。我们首先需要积累足够的组件,然后才能开始构建有意义的东西。
用第一次世界大战和第二次世界大战作为自然实验所得到的经验证据也支持这一观点,即训练是职业早期缺乏发现和创新的原因 [88] 。的确,战争打断了正常的生活,影响了职业生涯的训练阶段。当诺贝尔获奖者在20~25岁经历了“一战”或“二战”,即使战争已经结束,他们在25~30岁产出创新性成果的概率也大大降低。这也意味着,科学家并不是在某一特定年龄就能变魔术般地开始创新,相反,训练阶段被中断的时间必须得补上。这项发现与心理学广泛讨论的“1万小时定律”是一致的,该假设估计,要在人类能力所及的任何领域取得卓越成就,需要差不多10年的专门训练 [93]-[95] 。
当科学家完成训练阶段,可能就会迎来一个成果多产期,就像图4-2中事业峰值与所处年龄对应关系所展示的那样。但图4-2同样也显示了,在中年时达到事业峰值之后,取得科研上重大突破的可能性就会逐渐下降。与早期的快速上升相比,这种衰减相对要缓慢一些。
这种衰减可能源于多种因素,如技能过时、健康退化等。但是,这些都无法解释为何衰减会发生得这么早,因为它通常在50岁前就出现了,而这一年龄段远远早于生物学所定义的老年。正是这个原因,其他一些解释就显得更加合理,它们考虑了科研过程中的现实情况,包括家庭责任和不断增加的管理职责。也就是说,年龄偏大的科学家也许完全有能力产出重要的科研成果,却受制于有限的时间。相反,他们要投入大量时间管理实验室、申请科研经费、审阅论文以及决定职位任免等事务。有趣的是,科学家的职业生涯有时会在其退休之前迎来“第二次巅峰”,这可以解释为他们可能急于将剩余的想法和未发表的研究结果付诸成文 [89] , [96]-[98] 。
这些发现可以帮助我们更好地回过头来思考美国科学界所面临的挑战(见图4-1):虽然资深研究人员经验更为丰富,但科学家往往是在他们更年轻时产出了最重要的成果,这意味着科研资金偏向于较年长的研究人员可能会扼杀创新。比如,自1980—2010年,共有96名受到美国国家卫生研究院资助的科学家获得了诺贝尔生理学或医学奖和诺贝尔化学奖,但他们在做出这些获奖成果时,平均年龄为41岁 [99] ,这比当前首次获得美国国家卫生研究院资助的研究人员的平均年龄小了整整1岁。
什么因素决定我们的创造力达到巅峰的时间点呢?许多人相信,科学家的研究领域最为关键,因为有些领域比较新颖,可以说是“年轻”领域,而另一些领域则相对传统,较为“年长”。的确,盛行一时的猜想是,在那些以推理和直觉为主的学科里,科学家会在较年轻时取得重大成就,这就解释了为何相对于医学,在数学或物理这样的学科中,科研巅峰会更早出现 [85] , [100]-[102] 。
但是,人们越来越质疑这些刻板印象:凡是物理学家,就一定是年轻有为,而医学博士则往往形容枯槁。通过对文献的全面分析,研究人员将不同研究领域内达到巅峰时期的年龄制成表格。将所有这些数字集中放在一起,他们发现巅峰时期的年龄覆盖了全年龄段 [89] ,并没有明显的所谓“年轻”或“年长”的领域。即使是物理学对比医学这样的经典例子似乎也经不起推敲。例如,虽然在20世纪二三十年代,诺贝尔物理学奖获奖者要比其他领域的获奖者年轻,但自1985年后,诺贝尔物理学奖得主在做出获奖成果时,其年龄实际上比其他领域获奖者的年龄要大 [103] 。
如果决定性因素不是研究领域,那又会是什么呢?下面来介绍两个颇具说服力的理论:知识负担论和工作性质论。
稍微再注意一下图4-2,即可得到一个有趣的规律 [88] 。如果将20世纪分为3个连续的时间段,诺贝尔奖获得者和伟大发明者的数据将呈现出一个系统性的变化(见图4-3):拥有最强大脑的科学家的巅峰年龄随着年代变化有所增加。在诺贝尔奖的早期,有2/3的获奖者是在40岁之前做出他们的获奖研究,20%是在30岁之前获此殊荣。最年轻的诺贝尔物理学奖获得者劳伦斯·布拉格(Lawrence Bragg)获奖时只有25岁。而在今天,一位物理学研究者在25岁时,可能才刚刚决定要报考哪个学校去攻读博士学位,从而开始自己的专业训练。从1980年开始,取得诺贝尔物理学奖获奖研究的平均年龄已经变成48岁。总体上说,在整个20世纪,诺贝尔奖得主和发明者做出重大成就时的年龄越来越大,平均巅峰年龄总体增加了约6岁。
图4-3 重大创新年龄分布中的变化
数据涵盖诺贝尔奖获得者和伟大发明者。20世纪被划分为3个连续的时间段:1900—1935年、1935—1965年以及1965—1999年
[88]
。
有两个推断貌似可以合理地解释这一年龄转变。第一种推断认为,创新的生命周期已经发生了变化,所以如今具有卓越才智的人在职业生涯的后期才开始创新。这可以归结为他们需要更长的时间接受教育,推迟了主动进行创新性活动的开始时间。第二种推断则认为,巅峰年龄上升的趋势只是反映了世界总体的人口结构变化。换句话说,如果世界人口的平均年龄更大,那么从事科学研究的科学家们应该也不例外。
但是,即使控制人口结构的影响,仍然无法解释巅峰年龄显著改变的现象,特别是职业周期早期的推迟,即创新者活跃期的起始时间 [88] 。比如在20世纪初,科学家在23岁时便开始进入“科研活跃期”,但到20世纪末,这一时间则推迟到了31岁。
为了解释我们观察到的变化,琼斯(Jones)提出了“知识负担”理论 [88] , [104] , [105] 。首先,创新者必须接受充分的教育才能了解到前沿知识;其次,科学知识以指数级快速增长,为到达前沿所需掌握的知识量也随着时间不断增加。这个理论从一个新角度诠释了牛顿的那句“站在巨人肩膀上”的名言:为了站在巨人的肩膀上,首先必须要攀登到他的背上,而知识的体量越大,这一攀登的路程就越长。
显然,教育是创新的先决条件 [88] 。如果科学家想要在年轻的时候创新,那么在训练上多花了一分钟,就相当于他们在推动科学向前迈进上少花了一分钟,这在无形中就减少了科学家在个人职业生涯中的整体产出。如果每位科学家的创新时间变少,那么整个科学界的创新也将变少 [89] 。简单计算一下便可知道,普通研发人员在提高总体产出上投入的时间仅仅是20世纪初的大约30%,这一变化可归结为知识负担。换句话说,就专利数和产出量这两个指标而言,研发人员人均产出明显下降可能就源于科研巅峰对应的年龄变大 [106] 。
当前,不仅科学发现延迟了,对发现的认可也同样如此 [107] 。事实上,科学家做出值得荣膺诺贝尔奖的发现,与他真正被授予诺贝尔奖中间的间隔期也在持续延长。1940年之前,在诺贝尔奖获得者中,只有11%的物理学奖得主、15%的化学奖得主以及24%的生理学或医学奖得主,在做出原创性发现的20年后才得到认可。而自1985年以来,这种20年认可延迟在以上3个学科获奖者中所占比例分别达到60%、52%和45%。科学发现和它得到正式认可之间的时间间隔接近指数增长。这预示着,到21世纪末,获奖者的平均年龄可能会超过他们的预期寿命。也就是说,大多数候选人都可能活不到他们参加诺贝尔奖颁奖仪式的那一天。考虑到诺贝尔奖不能死后追认,这种延迟有可能会降低这一最有声望的奖项的权威性。
海森堡于1920年刚进慕尼黑大学时,由尼尔斯·玻尔、阿诺德·索末菲(Arnord Sommerfeld)等人创建的原子理论虽然在某些领域获得了成功,但同时也遭遇到了严峻的挑战。海森堡在索末菲的指导下,于1923年在慕尼黑大学获得博士学位,随后前往德国哥廷根大学同马克斯·玻恩(Max Born)共事,并于1925年创建了矩阵力学。第二年,海森堡在哥本哈根大学成了玻尔的助手,并在25岁时提出了“不确定性原理”。在20世纪,历史学家在文献中反复提到海森堡的“非凡才能:对数学工具的熟练运用以及大胆的物理洞察力”——语出他的博士导师索末菲。
但鲜为人知的是,海森堡差一点没能通过博士论文答辩。1923年7月23日,22岁的海森堡面对着慕尼黑大学的4位教授,轻松回答了索末菲的提问以及与数学相关的问题,但在回答天文学问题时则显得磕磕巴巴,在实验物理方面则没有通过 [108] 。最后他通过了答辩,成绩差不多是C。第二天早上他来到马克斯·玻恩的办公室,尽管当时玻恩已经聘用他作为来年的助教,但海森堡仍难为情地说道:“不知道您是否还会要我。”
你可能会问,这么一位有着非凡才华的物理学家,怎么会在他所研究领域的基础知识方面不及格呢?也许能从创新者类型上找到答案。从广义上说,学术创新性上存在两种极端表现:概念型和实验型 [109] 。实验型创新者以归纳法从经验中积累知识。这种类型的研究严重依赖他人的工作,更倾向于实证性。而海森堡则属于概念型创新者,利用抽象的原理,通过演绎推理进行研究。因此,他的研究往往源于先验逻辑,更具有理论性。这两种创新间的差异表明,科学家的研究性质影响了他能在何时达到事业巅峰:概念型创新者往往会比他们的实验型同行更早做出重大的研究成果。
为了了解两类科学家职业生涯的差异性,研究人员按照研究成果的性质,将荣获诺贝尔奖的经济学家划分为概念型和实验型两组,并统计了每组成员在发表最重要成果时的年龄 [109] 。其中的差别显而易见:概念型获奖者做出最重大科学贡献的平均年龄是35.8岁,而实验型获奖者平均年龄却为56岁,两相比较,中间竟然相差了20.2年。事实上,在概念型诺贝尔经济学奖获得者中,有70%在其职业生涯的前10年就发表了他们最重要的成果,而实验型获奖者中却没人能做到。
按照研究成果的性质,还可以将它们分为实证范畴和理论范畴。注意,这种区分与概念型和实验型的区分并不等同。虽然概念型创新更倾向于理论性,但是概念型创新者也可以专注于实证研究。同样的道理,实验型创新者也可以做出理论贡献。尽管如此,将诺贝尔获奖者划分到实证范畴或理论范畴时,仍然出现了相似的特征(见图4-4) [89] :在做出获奖发现时,实证范畴的研究者比理论范畴的研究者大了4.6岁(分别为39.9岁和35.3岁)。
图4-4 诺贝尔奖获奖者中理论家和实证家对比
本图对诺贝尔奖获奖者进行了分类,将获奖研究分为理论型和实证型,显示出两者在创新生命周期上的明显差别
[89]
。
为何在职业生涯中,概念型成果出现得较早,而实验型成果则正好相反呢?对此有多种解释 [89] 。
第一,像海森堡这样的概念型创新者不需要积累大量的经验就能有所贡献。相反,从事实验研究的达尔文则需要慢慢积累创建理论所需的证据。毫无疑问,达尔文是一位天才博物学家,但如果他没有登上小猎犬号勘探船进行环球航行,他的研究就会无疾而终。收集所有的证据并寻找它们之间的联系,需要耗费大量时间。事实上,旅途本身就花了5年时间。这意味着,达尔文用了5年时间旅行,只是收集到了撰写《小猎犬号航海记》( The Voyage of the Beagle )的素材。
第二,一些极为重要的概念型研究成果会有很多与现有范式相违背的地方。若是短暂接触,但又不沉浸其中,可能较容易逃脱传统观念的束缚。因此,一方面,经验有利于实验型创新者;另一方面,某一领域全新的东西有利于概念型创新者。确实,博士答辩的惨况并没有阻止海森堡做出他的开创性成果。从某种程度上说,这对他还有所帮助。也就是说,知道得太多也许还会“扼杀”你的创造力 [110] , [111] 。
从某种意义上说,概念型和实验型创新者就像科隆啤酒和年份波特酒。前者最好是新鲜时喝,而后者随着时间的积淀会口感更佳,单宁酸的味道更为柔和。这种创作过程的对比方法也应适用于科学以外的领域。在当代最为重要的概念型创新者当中,有爱因斯坦、毕加索、安迪·沃霍尔、鲍勃·迪伦等,他们都是在24~36岁做出了各自开创性的贡献。而像达尔文、马克·吐温、保罗·塞尚、弗兰克·劳埃德·赖特(Frank Lloyd Wright,建筑大师),罗伯特·弗洛斯特(Robert Frost,知名诗人)这样一些伟大的实验型创新者,他们最伟大的贡献是在48~76岁做出的 [112] , [113] 。从事研究的性质具有如此之强的预测力,能够告诉我们创新者在什么时候能达到事业的巅峰,甚至有时你根本不需要数据来验证它的结果。以艺术为例,在图4-5中,我们将米开朗琪罗和毕加索的作品并排放置,你能猜出谁是科隆啤酒,谁是年份波特酒吗?
图4-5 米开朗琪罗与毕加索
并列的两张名画。(a)《创造亚当》(
The Creation of Adam
),米开朗琪罗。(b)《女人与芥末瓶》(
Woman With Mustard Pot
),毕加索。你能猜出这两位艺术家谁的创作巅峰来得早一点,而谁需要更长时间才达到成熟吗?
人们普遍持有的观点是,年轻一些的研究者更可能与传统彻底决裂。马克斯·普朗克(Max Planck)对此有过生动的描述:“一个新的科学真理不是通过说服对手、让他们看到光明而获得胜利,而是源于对手最后离开人世,熟悉新理论的年轻一代成长起来。”这一思想流派认为,年龄是驱动科学发展的重要因素。也就是说,如果年轻的和年长的科学家对接受新思想有不同的偏好,那么就不得不等到老一代科学家的重要影响消失,然后该学科才能进一步向前发展。但持不同观点的另一种思想流派认为,新思想的胜利在于获得更多的实验证据支撑,从而战胜相互冲突的假设。因此,在科学上,理性、论点和证据都很重要,这也表明年龄因素可能并不像我们想象的那么重要。那么,普朗克的话对科学来说也是如此吗?
尽管人们一向认为年轻的研究人员更愿意与传统彻底决裂,但一直以来,能够支持普朗克理论的证据是有限的。比如,D. L.赫尔(D. L. Hull)和他的同事发现,年长的科学家在接受达尔文的进化论方面与年轻的科学家一样快 [114] 。该发现支持这样的观点,科学通过自我纠错,在真理的引导下才得以进步。但是,有一项研究,针对的是452名在职业巅峰时期突然离世的杰出生命科学学家,这项研究的结果为普朗克的理论提供了实证支撑 [115] 。在某位著名科学家突然离世之后,经常与他合作的同事们,也就是和他合作撰写论文的那些科学家,会经历科研产出上的骤然下降。同时,该领域中新兴的研究者在论文产出上有显著的上升,而且这些论文有更大的可能获得高引用量,它们的作者也更有可能是该研究领域之外的年轻科学家。
这些研究结果与另外一项有关年龄与接受新思想之间关系的调查结果一致。将论文中出现的新词视为新思想的代表,研究人员测量发现,相比于年长的科学家,年轻科学家更有可能使用新词来表述令人兴奋的创新性主题,而当他们这样做之后,由此产生的相关研究会斩获更大的影响力 [111] 。这些结果证实了科学上的“歌利亚 (15) 的阴影”:当某位重要的学者在世时,局外人不太愿意在他的领域去挑战他;但是一旦他离开人世,众人便蜂拥而至,接管他的统治权。
不管申请美国国家卫生研究院基金的科学家是概念型还是实验型创新者,伊莱亚斯·泽霍尼的态度都至关重要:年长的科学家需要资助从而迅速创新,而年轻的科学家需要资金去收集证据以助力他在10年以后取得重大进展。总体上说,本章揭示了年龄与科学成就之间的紧密联系,表明科学家学术表现的高峰期到来得相对较早,随后便是快速甚至无情的衰减。一旦我们过了高峰期,取得重大科研突破的希望开始变得渺茫。
或者至少看起来是这样。虽然我们在这里分享的研究是切实可信的,但年长的科学家仍然可以心怀希望。因为故事中还有故事,你会在下一章看到它们。
到目前为止,在所讨论的有关年龄和成就的研究中,有一点是相同的:它们关注的都是著名科学家,那些被我们称赞为天才的人。这些研究得出的结论,与我们这些凡夫俗子有关联吗?
对卓越科学家的这种长期关注合乎方法论:这一领域大多数现存的知识都是通过手工做成统计表格,草草地记下重要研究产生的日期,估算科学家完成这些研究时的年龄,有时还要在图书馆浩瀚的文献中找出证据。同时,著名科学家的信息也更容易获得,因为这些内容都在传记和颂词中有所记载。
即便是今天,虽然计算机极大地降低了数据收集和整理的工作量,但考虑到第1章(“解决‘谁是谁’的问题”部分)所讨论的论文署名歧义带来的挑战,研究个人职业生涯仍然是一项艰难的任务。然而,多亏了数据挖掘和机器学习方面的进步,通过使用科研选题、作者所在机构以及引用模式等多方面信息,人名消歧的准确性在过去10年得到了极大提高。因此,研究者就可以获取到更多、更全面的关于科学家个人职业生涯的历史信息,这里指的不仅是天才科学家,也包括在这一领域辛勤耕耘的普通科研人员。这些技术进步也为相关研究提供了新的契机。我们将在本章看到,数据并不只是检验和证实了现有的理论和框架,它实际上彻底颠覆了我们对于个人职业发展的思考方式。
图5-1(a)显示了1982年诺贝尔物理学奖获得者肯尼思·G.威尔逊(Kenneth G. Wilson)的科研生涯。我们将他第一次发表论文视为他学术研究的起点,他每发表一篇新论文,我们就在他职业生涯相应的时间点(学术年龄)上添加一枚大头针。大头针的高度表示论文的影响力,近似等于论文发表后10年所获得的总引用量。
图5-1 肯尼思·G. 威尔逊的论文发表史
(a)水平轴显示威尔逊第一篇论文发表后的年份,每一条垂直线代表一篇发表的论文。每条线的高度代表
c
10
,即论文发表10年后获得的总引用量。威尔逊引用量最高的论文发表于1974年,也就是他第一篇论文发表后的第9年,是他48篇论文中的第17篇,因此
t
*
=9,
N
*
=17,
N
=48。
(b)威尔逊被打乱的职业生涯,我们保留大头针的位置,但将每篇论文的影响力用另外一篇的影响力替换,从而打乱威尔逊职业生涯中最重要成果产生的时间顺序
[116]
。
通过这种“放图钉”的表现方式,我们能够呈现出每一位科学家的职业生涯。对不同学科的成千上万名科学家重复这一步骤,我们就能够回答一个简单却难以回答的问题:尽管关于天才科学家有大量的文献研究,但普通科学家在什么时候能发表他们最重要的研究成果?
有人通过分析众多物理学家的职业生涯史得到这个问题的答案。研究者检索了曾在《物理学评论》( Physical Review )上发表过论文的236 884名物理学家的出版记录,并按照“论文发表记录至少横跨20年”这一条件从中筛选出了2 856人 [116] 。我们能够从数据中定位每位科学家最优秀的成果,即他已发表的论文中引用量最高的论文。为了查清科学家在什么时候发表了自己最有影响力的论文,我们采用 t * 值描述科学家发表最优秀的论文时的学术年龄。 t * 会标注亚历山大·弗莱明关于“产黄青霉菌”(Penicillium Chrysogenum)的论文,或者玛丽·居里的关于放射性的论文,但它也可以标注隔壁办公室同事的论文,这些论文的引用量或许要可怜得多,却是论文作者最好的一篇。
图5-2为 P ( t * )的函数曲线图,即某位科学家最有影响力的论文发表于自己第一篇论文 t * 年后的概率。 P ( t * )在0~20年达到较高值表明,大多数物理学科研人员是在职业生涯的早期或中期发表他们最有影响力的论文,在这一时期之后, P ( t * )便有明显的回落。这证明,一旦科学家过了职业生涯中期,就不太可能再有突破性的研究成果。
图5-2 随机影响规则
科学家职业生涯中最高影响力论文发表时间
t
*
的分布(实线)以及对职业生涯随机化后的分布(虚线)。两条曲线差别并不明显,表明科学家发表的论文中,影响力是随机分布的
[116]
。
但是,进一步仔细分析可以发现,解释这个曲线并不像最初预想的那么简单。为了理解这一点,先来思考一个问题:如果最高影响力论文的产出时间完全是随机的,那么这张图会呈现什么样的结果呢?
试想一下,职业生涯中的创造性纯粹是随机的。要理解这样的随机生涯看起来像什么,我们随机挑选两枚大头针,然后互换,重复这个动作数千次。这样,我们就得到每位研究人员职业生涯被打乱的另一个版本[见图5-1(b)]。被打乱的职业生涯和他真实的职业生涯差别在哪里?个人的论文产出并没有改变,这些论文总体的影响力也没有变化,因为我们没有改变大头针的长短,也没有改变论文的发表时间。唯一改变的是这些论文发表的顺序。将你所有的论文想象成发给你的一叠扑克牌,你最有影响力的论文是方块A,然后我们洗牌,将包括A在内的扑克牌的顺序打乱。现在,你的方块A可能出现在这叠扑克牌的任何位置——上面、中间或是下面。
下一步,我们在打乱的职业生涯中测量 P ( t * ),然后将打乱顺序后得到的 P ( t * )与真实的职业生涯在一张图中绘制出来。令人意想不到的是,图5-2的两条曲线几乎相互重合。也就是说,在被随机打乱的职业生涯中,最重要的研究成果的发表时间与原始数据没有太大差别。这意味着什么呢?
图5-2中两种分布曲线相同,这表明 P ( t * )的变化可以完全由职业生涯中产出率的改变来解释。确实,那条随机曲线描述了某位研究人员职业生涯中产出率的变化。它表明在这个样本中的研究人员,产出率会在职业生涯的第15个年头迎来一个高峰,然后在第20年之后快速回落。这意味着,年轻科学家在事业的早期有一些重大的突破,并不是因为年轻和创造力紧密相连,而只是因为他们正处于最多产的时期。换句话说,如果产出率能够调节,那么最有影响力的论文将在职业生涯中的任何时刻出现。我们将这种现象称作“随机影响规则” [116] 。
我们还是继续使用扑克牌的比喻。想象一下,你一次从一叠牌中抽出一张,但频率不同。刚开始工作时,你感到兴奋,扑克牌抽了一张又一张,一刻不停,踌躇满志地要找到那张A。过了这段时期之后,节奏逐渐变慢,你伸手拿牌的节奏也慢了下来。如果扑克牌是事先完全洗好的,而且在前20年抽到的牌远多于在此之后抽到的牌,那么什么时候最有可能抽到A呢?当然是前20年。也就是说,职业生涯的前20年并不比后20年更具创造力。在职业生涯早期抽中了A,仅仅是因为你付出了更多努力。
要更直接地测试随机影响规则,我们可以看一看在一叠扑克牌中,A会出现在哪里。为此,让我们来计算一下最高影响力论文 N * 在发表的一系列论文 N 中的位置。然后计算 P ( N * / N ),即在该序列中某一位置发表引用量最高的论文的概率, N * / N 取值越小表示所处阶段越早, N * / N≈ 1则表示处于后期。如果随机影响规则是有效的,那么 P ( N * / N )应该服从均匀分布,即无论 N * / N 的取值如何变化,最优秀论文出现的概率是相同的。用专业术语来说,这意味着累积分布 P > ( N * / N ) (16) 必须呈现线性下降,服从( N * / N ) -1 。数据完全符合随机影响规则的预测[见图5-3(a)]。
图5-3 创造性领域的随机影响规则
累积分布 P > ( N * / N ),其中 N * / N 表示职业生涯中影响力最大的论文的顺序 N * ,数值范围为1/ N ~1。 N * / N 的累积分布是一条斜率为-1的直线,表明在某人的作品序列中, N * 出现在所有位置的概率相同。该图显示了20 040名科学家[见图5-3(a)]、3 480名艺术家[见图5-3(b)]以及6 233名电影导演[见图5-3(c)]的 P > ( N * / N ) [112] 。对每一位从事创造性工作的个人,我们取他的3件最有影响力的作品(论文、艺术品或电影),分别根据引用量、拍卖价格和在互联网电影数据库(IMDb)中的评分等级进行衡量,然后度量它们在其职业生涯中的相对位置。这些图证实,在这3种职业生涯中,3件最有影响力的作品,每一件的完成时间在所有作品序列中都是随机分布的 [117] 。
但为什么探讨只停留在最有影响力的论文上?影响力位列第二的论文是什么情况呢?位列第三的呢?你可能猜到了,没错,相同的规律再次出现了[见图5-3(a)]。累积分布曲线明显是一条直线。也就是说,你职业生涯中的重大突破随时都会降临,而且这一规律并不局限于最优秀的成果,其他重要程度不等的成果也同样是随机分布的 [117] 。这一随机影响规则不仅可以用来解释科学家的职业生涯,同样也适用于各种创造性领域从业者的职业生涯,比如艺术家和电影导演(见图5-3) [117] 。
随机影响规则这种概念在文献中多有记载,最早可以追溯至20世纪70年代西蒙顿(Simonton)所做的研究,他提出过一种叫作“成功的恒定概率”的模型 [2] , [118]-[121] 。长期以来,研究人员怀疑,同样的规则也适合于艺术界,比如文学和音乐创作 [118] ,直到40多年之后,用于验证这一想法的数据集才被收集起来。
第4章的结论表明,诺贝尔奖的获奖成就往往产生于获奖者职业生涯的早期。然而本章的内容则表明,普通科学家的职业生涯是受随机影响规则支配的。那么,随机影响规则也适用于诺贝尔奖得主的职业生涯吗 [122] ?为此,在获诺贝尔奖之前发表的论文中,我们测量了获奖论文和引用量最高的论文在论文序列中的位置(51.74%的引用量最高的论文同时也是获奖论文),发现这两者往往都位于论文序列的早期[图5-4(a)]。这表明与普通科学家相比,诺贝尔奖得主往往更早就发表了他们最重要的论文。
但是,我们还必须面对一个选择效应——由于诺贝尔奖从未追授给去世的人,因此那些较早产出突破性研究成果的科学家更有可能获奖。为了验证这一猜想,我们拿掉有可能受到这种选择偏差影响的诺贝尔奖论文,衡量余下3篇最有影响力的论文的产出时间,发现它们全都随机分布于诺贝尔奖得主的整个职业生涯中[见图5-4(b)]。这表明,除了获奖论文以外,诺贝尔奖获得者在其职业生涯中的其他所有重要论文也都遵循随机影响规则。这一选择偏差表明,存在“遗失的获奖者”:某些科学家发现了足以获得诺奖的重要研究成果,但是由于这些成果在其职业生涯中出现得较晚,从而未能获得诺贝尔奖委员会的认可。
图5-4 诺贝尔奖得主的职业生涯模式
(a)在授予诺贝尔奖之前,所有论文序列中获奖论文和引用量最高的论文相关位置的累积分布(
N
i
/
N
)。虚线表示随机影响规则的预测。
(b)为了消除获奖论文发表时间上潜在的选择偏差,我们去掉了获奖论文,计算获奖之前所有发表的论文中,其余三篇引用量最高的论文所在的位置,发现这些论文仍然遵循随机影响规则
[122]
。
随机影响规则改变了人们对职业生涯何时出现重大发现这一问题的看法。的确,数十年的研究证实,重大发现通常发生在科学家职业生涯的早期。这也导致了一种根植于大众文化的神秘观点,即创造性属于年轻人。随机影响规则将年龄和创造力分离开来。它告诉我们,在职业生涯中产生的所有成果中,某项成果成为重大突破的概率完全是随机的。准确地说,我们所做的每一个项目成为个人最优秀成果的概率是一样的。不具有随机性的是产出率:年轻的研究人员总是热切地不断尝试,论文一篇篇地发表。如果影响力在个人从事的所有项目中随机存在,那么从统计学上讲,具有影响力的成果总会在职业生涯早期的某个时候产生,因为那时的产出率更高。
随机影响规则为我们认识产出率的作用提供了一个新视角:它告诉我们,要想获得期待已久的科研突破,反复尝试是极其重要的。确实,对于那些持之以恒的人来说,重大科研突破并不是那么难以实现的。约翰·芬恩就是一个很好的例子。在他被耶鲁大学强制退休,正式的学术生涯就要结束时,他发现了一个新的电喷雾离子源。他没有放弃,离开耶鲁后,在弗吉尼亚联邦大学得到一个新的教授职位,继续他的研究,最终发现了电喷雾离子化技术。正是这一发现使他在15年之后获得了诺贝尔奖(见图5-5)。总之,他的例子以及随机影响规则都表明,那些在职业生涯后期产出率没有下降的科学家,他们的影响力可能也不会衰减。
图5-5 2002年诺贝尔化学奖获得者约翰·芬恩的学术生涯
虽然随机影响规则加深了我们对科学家职业生涯规律的认识,但它也提出了一个新的问题:如果重大成果产生的时间是随机的,那有没有什么因素不是随机的呢?
“年轻等同于创造性”这一信条并不限于科学界,它在企业界同样根深蒂固。事实上,硅谷科技博客奖的获奖者平均年龄为31岁,荣登《公司》( Inc. )和《企业家》( Entrepreneur )杂志“顶尖企业家”榜单的人,平均年龄为29岁。红杉资本是一家著名的风险资金管理公司,他们支持的创业者平均年龄为33岁,经纬创投的受资助者平均年龄为36岁。在硅谷,难道年轻是成功的代名词吗?
通过整合报税表、美国人口普查信息以及其他联邦数据,研究人员编制了一份包含270万名公司创始人的名册 [123] 。分析显示,与大众的认知不同,最优秀的企业家往往是中年人。在发展迅速的高新企业中,企业家在创建公司时的平均年龄为45岁。另外,50岁获得巨大成功的可能性是30岁同行的2倍。
这些结果表明,创业绩效随着年龄而激增。如果从两位企业家中选择,在除了年龄其他信息一无所知的情况下,与主流的观点相反,你通常最好把宝押在年长一点的人身上(见图5-6)。