给科学家的科学思维最新章节_王大顺著

保罗·厄尔多斯（Paul Erdős）可以说是20世纪最多产的数学家，从各方面看，他都是一个非常怪异的人。这位匈牙利数学家（第二次世界大战前移民美国）会将所有生活必需品都装在一个破箱子里，他就拖着这个箱子出没于世界各地的学术会议、大学，乃至同事的家中。这也成了他的一件逸事。他可以在未提前知会的情况下突然出现在某一位同事的家门前，欣喜地大叫：“我有灵感了！”然后与主人一道工作几天，随后又突然出现在另一所大学的某个同事家门口。这种经常性的辗转最后甚至引起了美国联邦调查局的特别关注。在数学界的同行眼中，他是一位性情古怪但讨人喜欢的数学家。但对于冷战期间的执法部门来说，他这样随意穿越铁幕的行为是极其可疑的。而他也确实在1941年遭到过逮捕，原因是他在一座秘密的无线电发射塔下闲逛。“你明白吗？我是在思考数学定理呢。”他用浓重的匈牙利口音向当局解释。最终经过数十次跟踪调查，联邦调查局才相信了他，认为他的漫步闲逛纯粹是为了思考数学问题。

他的一生也如此怪异。他没有妻儿，没有工作，甚至没有一个稳定的居所。他用担任各所大学客座讲师所得的酬金以及各种学术奖金，来应付旅行和基本的生活开销。他谨慎承诺，努力不让任何因素影响到工作。1996年，他在83岁的高龄去世，生前与511位同行合作，以独立或合作的方式共撰写了1 475篇学术论文，令人叹为观止。如果用论文总体发表量来衡量产出量，那么厄尔多斯与普通科学家相比，其产出量是什么样的水平？看起来，他确实非常出色，但究竟有多出色呢？

我们发表了多少论文

学术出版物是科学交流的主要媒介，有助于传播知识。科学家的产出反映了他在本领域内增加知识单元的速率。在20世纪，出版物的数量呈指数级增长，其中关键问题在于，知识体量的增加，究竟是由于科学家数量的增多，还是因为每位科学家的平均产出高于他们过去的同行？

相关研究分析了超过5 300万名作者和他们在科学界的所有分支学科发表的近9 000万篇论文，结果表明，论文和科学家的数量在20世纪都呈指数级增长 ⁴ 。一方面，作者的增长速度比论文的发表速度略高［见图1-1（a）］，这意味着人均论文数随着时间而降低。另一方面，对于每位科学家来说，个人的产出率在20世纪基本保持稳定。例如，在整个20世纪，科学家每年发表的论文数量一直约为2篇［见图1-1（b），蓝色］，在20世纪末的15年内略有增长。到了2015年，一名普通的科学家平均每年独自或合作撰写2.5篇论文。个人产出率增加的原因在于合作：当更多的论文以合作方式完成时，个人产出率也得以提升［见图1-1（b），红色］。换言之，就一篇论文所包含的作者数量而言，其趋势在20世纪是上升的。得益于合作研究，个人产出率在过去10年间才得以增加。

图1-1　不断增加的科学家数量

（a）在20世纪，科学家的数量和论文数量都呈指数级增长。

（b）每位科学家每年撰写的论文数在过去100年约为2篇，但在1985—2000年逐渐增长。这种增长的直接原因是合作效应：科学家以共同作者身份发表的论文数量增加了。使用某一独立研究领域内的数据进行分析也反映了相似的趋势 ⁵ 。例如在物理学领域，过去100年每位物理学家每年撰写论文的数量不足1篇，但在1985—2000年则急剧增加 ⁴ ^, ⁵ 。

不同学科的产出量有何不同

但是当我们跨学科讨论科学家的产出时，问题就不那么简单了。首先，每一篇出版物可能涵盖一个知识单元，可是不同知识单元的规模却大相径庭。对于一位社会学家来说，如果论文前言没有十几页，他可能就觉得自己没表达清楚。而最权威的物理学期刊之一《物理评论快报》（ Physical Review Letters ），却会严格地把论文篇幅限制到4页，这4页还包括插图、表格和参考文献。讨论个人产出量的时候，我们倾向于将某个人在科研期刊上发表的论文数量作为衡量手段。但在社会科学和人文科学的某些分支学科中，专著才是学术成果的主要表现形式。虽然一本专著也被算作一个出版物单元，但不可否认，产出这样的单元要投入更多的时间。

另外再看看计算机科学。作为一门最年轻的学科 ⁽⁷⁾ ，计算机科学采取了较为独特的出版传统。由于该领域发展迅速，计算机科学家一般选择会议论文而不是学术期刊，作为交流学科发展的主要方式。考虑到这一领域从互联网到人工智能所取得的一系列成就，这种方式在学科内运行得很成功，但对业外人士来说就有些难以理解了。

如果罔顾不同学科专业特点的不同出版习惯，后果可能比较严重。比如，针对大学、研究生院以及MBA课程的全球权威排名机构《美国新闻和世界报道》（ US News and World Report ，简称《美新周刊》），曾在2017年首次发布世界最强计算机科学院系的排名。这个排名如此荒诞，以至于美国计算研究会不得不发表一个特别声明，称此排名为“胡说八道”，是对读者的“严重伤害”。

为何这样一个专门从事学术机构排名且经验丰富的组织错得如此离谱呢？原来《美新周刊》是根据科学网（Web of Science）数据库中记录的期刊论文发表数量来评估排名的 ⁽⁸⁾ 。这一方法对其他所有学科都很有效，但是由于忽略了学术会议上发表的同行评审论文，《美新周刊》的排名完全偏离了计算机科学家对质量和影响力的认知。

不同学科之间产出量的差别，可以使用美国国家科学研究委员会针对美国博士培养所收集的数据进行量化 ⁶ ^, ⁷ 。用每个系全体教师在5年间发表论文的平均数作为指标，研究人员发现，这个数值从历史系的1.2篇到化学系的10.5篇不等，在不同学科间差异巨大。即使在相似的专业之间，我们也能看到很大的产出量差距。比如，对于生物学科，科学家的产出量从生态学的5.1篇到药剂学的9.5篇不等。

总而言之，这些数据至少极其清楚地表明了一项信息：无论我们如何衡量，一位普通科学家的论文产量与厄尔多斯都相差十万八千里。厄尔多斯总共发表了1 475篇论文，这意味着在60年里，他每个月写2篇论文，这实在令人难以置信。相比之下，一项针对1996—2011年1 500万名科研人员的调查发现，每年能够发表一篇论文的同行占比不足1%。 ⁸ 因此，只有少部分人才能保持一个稳定的发表频率。有趣的是，这个小小的百分比还包含了许多最具影响力的研究人员。尽管他们在所有曾发表论文的科研人员中占比不足1%，但这一稳定的核心群体却产出了41.7%的论文，并且其中87.1%的论文的总引用量超过1 000。如果某位多产科研人员的步伐慢下来，其学术贡献的影响力也将降下来。即使只停止发表1年，他的论文的平均影响力也会大幅降低。

虽然厄尔多斯只是一个特例，但他令人惊叹的产出量，表明了研究人员产出量之间的巨大差异。为什么会有这么大的差异呢？毕竟，每个人每天都只有24小时。为何厄尔多斯等人会比其同行的产出高出那么多呢？要回答这些问题，我们需要探访一下全盛时期的贝尔实验室。

产出量：你有可能会明显超出竞争者

将硅带入硅谷的是威廉·肖克利（William Shockley），他的职业生涯充满争议。20世纪五六十年代，他在将一种新型晶体管商业化的过程中，把硅谷改造成了电子学的孵化基地。但是他对优生学的鼓吹给他带来了麻烦，最终使他与同事、朋友和家人的关系疏远甚至形同陌路。肖克利在贝尔实验室度过了他最多产的年代，在那里他同约翰·巴丁（John Bardeen）和沃尔特·布喇顿（Walter Brattain）合作发明了晶体管。这项发明不仅使3人共同赢得了1956年的诺贝尔物理学奖，同时也开启了时至今日仍在继续的数字革命时代。

在贝尔实验室负责管理一个研究小组时，肖克利开始对这样一个问题感到好奇 ⁹ ：他的同事在产出上的差异可量化吗？带着这个问题，他收集了洛斯阿拉莫斯国家实验室（Los Alamos National Laboratory）和布鲁克海文国家实验室（Brookhaven National Laboratory）等美国国家实验室中雇员的论文发表统计数据。在对这些数据进行分析后，他得到了一个极为惊人的结果：曲线表明，若以 N 表示个人的产出量，即某研究人员发表的论文数量，那么它服从对数正态分布：

对数正态分布具有肥尾的特点，表明产出量存在巨大的差异。换句话说，肖克利意识到，大多数研究人员发表的论文数量非常少，而不可忽略的少数研究人员发表了比平均数多几个数量级的论文。公式1-1的证据见图1-2，其中标出了INSPECT科技文献数据库中列出的所有作者撰写论文的数量分布情况以及对数正态拟合 ¹⁰ 。

图1-2　产出率分布

方块符号表示1969—2004年，INSPECT科技文献数据库列出的所有作者（超过300万）发表的论文数量。红线对应数据的对数正态拟合（公式1-1）。

科学的真相

The Science of Science

对产出的研究具有悠久的历史 ^9-15

1962年，阿尔弗雷德·J.洛特卡（Alfred J. Lotka） ¹¹ 注意到科学家的论文产出量呈肥尾分布。换言之，他发现少数科学家完成了大部分的科研论文。洛特卡分析了1907—1916年《化学文摘》（ Chemical Abstracts ）上的6 891名论文作者，得出的结论是，具有 N 篇论文的作者数量遵循下列幂律分布：

其中，幂指数 α ≈2。幂律预示产出量有一个长尾，表明了个体之间的巨大差异。注意，我们需要大量的数据才能可靠地区别幂律分布与对数正态分布，而这是洛特卡在1962年时所缺少的。

肖克利很快就注意到，产出量的这种对数正态分布有些奇怪。确实，在大多数充满竞争的领域，个人能力表现的衡量指标几乎总是呈现一个狭窄的分布。以跑步为例，在2016年的里约奥运会上，尤塞恩·博尔特（Usain Bolt）以9.81秒完成100米决赛，贾斯廷·加特林（Justin Gatlin）和安德烈·德·格拉斯（Andre De Grasse）分列第二名和第三名，成绩分别是9.89秒和9.91秒。这些数字极其接近，反映了一个众所周知的事实，即人与人之间能力表现上的差异通常是有限的 ¹⁶ 。同样，即使在泰格·伍兹（Tiger Woods）的巅峰时期，他也只能领先最强的对手几杆。最快的打字员比一名普通打字员每分钟也就多打几个字。能力差异的有限性提醒我们，在任何领域，要以显著优势在竞争中获胜，并非完全不可能，但十分困难 ⁽⁹⁾ 。然而，图1-2显示，这种有限性在学术表现上似乎说不通。显然，就论文数量而言，你有可能会明显超出竞争者。为什么会这样呢？

为什么会这样多产

肖克利提出了一个简单的模型，解释他观察到的产出量的对数正态分布（见公式1-1） ⁹ 。他认为，要发表一篇论文，一名科学家必须同时兼顾多个因素。比如：

· 因素1（F ₁ ），发现一个好的选题；

· 因素2（F ₂ ），就这一选题取得进展；

· 因素3（F ₃ ），找到有价值的结果；

· 因素4（F ₄ ），决定何时结束研究并开始整理记录结果；

· 因素5（F ₅ ），充分论述；

· 因素6（F ₆ ），从批评中获得建设性意见；

· 因素7（F ₇ ），决定向期刊提交论文；

· 因素8（F ₈ ），应刊物或审稿人要求还要对论文进行修改。

这些环节中任何一步出错，论文发表就会泡汤。假设一个人清除障碍F _i 的概率是 p _i ，那么一位科学家的论文发表量与清除后续每项障碍的概率成正比，即 N ～ p ₁ p ₂ p ₃ p ₄ p ₅ p ₆ p ₇ p ₈ 。如果这些概率的每一项都是独立的随机变量，那么这个过程的乘性表明， P ( N )遵循公式1-1形式的对数正态分布。

要理解离群值来自何处，想象一下，科学家A与科学家B在所有这些因素上的能力都相同，仅有的差异在于A在解决问题（F ₂ ）、知道什么时候结束研究（F ₄ ）以及决心（F ₇ ）方面比B优秀1倍。那么结果就是，A的产出率将是B的8倍。换句话说，B每发表一篇论文，A将发表8篇论文。因此，科学家在障碍清除能力上的微小差别，可能导致总体产出量的巨大不同。

肖克利的模型不仅解释了产出量为何服从对数正态分布，同时也提供了一个提高自我产出的理论框架。这个模型提醒我们，发表论文并不能依靠有一个好点子这样的单一因素。相反，它要求科学家在多种因素上都要足够优秀。看到某人极其高产时，我们倾向于将此归结为单一的独特因素，比如某个教授在构思新选题（F ₁ ）或将想法写成文字（F ₅ ）方面确实突出。但该模型显示，单一因素是无法解释离群值的。一位研究人员只有在诸多因素上都出类拔萃，没有弱项，才有可能成为最高产的科学家。

这个障碍模型表明，一项弱点就有可能扼杀某人的产出量，即使他有许多优点。这也告诉我们，厄尔多斯并不一定是我们想象中的超人，他的产出量有可能是通过对不同技能的精心打磨而实现的。的确，如果我们能够在论文写作的各个步骤上加以改进，即使每个步骤的改进都非常微小，综合起来，这些进步带来的产出率提高将是指数级的。当然，这说起来容易做起来难。但是你可以用这个模型进行自我诊断，看看到底是哪个步骤对你的产出率影响最大。

产出量上的明显差异，会对回报产生影响。实际上，肖克利做了另外一项重要论述：虽然一位科学家的产出量是非线性的，他的薪酬——通常与能力表现挂钩的奖励形式，却是线性的。收入最高的雇员，薪酬比其同事最多能高出50%～100%。这其中的原因有很多，比如，这样肯定看起来更公平一些，也更有利于培养合作氛围。但如果从“一篇论文对应一份薪水”的角度来看，肖克利的发现引出了一些有趣的问题，比如是否可以利用线性的薪金和非线性的产出量之间的不对等。现实情况也的确如此，一个科研机构雇用几个明星科学家可能就赚大了，即使付给他们比同行高得多的报酬也不亏。肖克利的论点经常被当作理论依据，来解释科研密集型机构为何会用高薪和额外待遇聘用顶尖人才，以及大学的一流院系为何能获得高得不成比例的经费和资源。

当然，仅以论文发表数量来衡量个人的职业发展，无疑是对科学运作机制的严重曲解。但有研究表明，个体的产出量与科学家在各自领域的显性贡献以及他的知名度是紧密相关的。这样的范例早在1954年就被韦恩·丹尼斯（Wayne Dennis）所证实 ¹ 。丹尼斯调查了71名美国国家科学院院士和声名显赫的欧洲科学家。他发现，几乎无一例外，高产的研究人员同时也在科学界享有崇高的声望，他们或被列入《大英百科全书》，或其科学贡献被记录在重大科技发展史中。高产出率能增加获得终身教职 ¹⁷ 以及获得后续研究经费 ¹⁸ 的概率。在院系层面上，导师的论文发表速度不仅是学位点声誉的可靠指标，也影响着毕业生是否能够获得教职 ¹⁹ 。

总而言之，持续的高产出尽管稀有，但它与科学影响和声望紧密相关。考虑到这个例证，产出量似乎是科研职业发展是否顺利的关键指标。但正如我们将在后续章节里看到的那样，在用于量化科研工作是否优秀的许多指标中，产出量的预测能力是最差的。原因很简单：尽管伟大的科学家往往非常高产，但并不是所有高产科学家都能做出举足轻重的学术贡献。事实上，大多数科学家都没有做到。能够获得高产出的途径有很多，比如，某些领域内的实验室技术人员的名字可能会出现在上百篇乃至上千篇的论文上。如果单看署名的论文数量，他们看起来极其多产，但他们极少被认为是该研究的知识产权人。人们发表论文的方式也在发生变化 ²⁰ 。共同作者的数量在不断地增加，基于同一份数据发表多篇论文的现象也越来越多。当前，关于“最小出版单元”（Least Publication Unit） ²⁰ ，也被称为“香肠论文”（salami publishing） ⁽¹⁰⁾ ，科学界已有许多讨论，这一现象可能进一步造成产出数量的虚高。

如果科研产出量不是职业发展的决定性因素，那什么才是呢？

科学的真相

The Science of Science

解决“谁是谁” ⁽¹¹⁾ 的问题

要想精确跟踪某人的科研产出，我们需要找出他所写的论文以及他名下的所有其他成果 ²¹ ^, ²² 。这看起来似乎非常容易，实际上却根本做不到。这主要受制于4个方面 ^21-23 。第一，同一作者在论文中可能存在多个名字。原因可能在于拼写差异及错误以及因婚姻状态、宗教信仰和性别改变所导致的姓名改变，或者是使用了笔名。第二，一些常见的名字导致重名严重。第三，一些必要的元数据往往不完整或缺失，包括这样一些情况：出版社和文献目录数据库没有记录作者的姓氏、所在地理位置，或者其他有助于身份识别的信息。第四，越来越多的论文不仅作者众多，而且也是多学科、多院系合作的产物。在这样的情况下，确认一部分作者的信息，并不能有效帮助我们确认剩余的作者。

虽然人们现在已经开始采取多种方法来解决“谁是谁”这一问题，但我们还必须意识到本章和后续章节中的一些结论可能也会受到“谁是谁”的影响。总之，与仅仅发表少量论文的人相比，高产科学家不容易产生人名混淆问题，因为他们有一个长期的、可追踪的论文发表记录。因此，许多研究通常会关注具有较长职业生涯的高产学者，而不是“普通的”科学家。