科学外史III最新章节_江晓原著

中国学者和媒体对“影响因子”计算公式普遍误解

关于“影响因子”的江湖故事，我已经讲述到六回之多，随着最近汤森路透决定将SCI和“影响因子”业务转卖的新闻在国内传播开来，这个故事第二回中揭示的“影响因子”的纯粹私人商业性质，进一步得到确认，并引起学术界更为广泛的关注。

而在上两回中，我讨论了两栖化SCI期刊上的大众文本对期刊“影响因子”的直接贡献和隐性贡献。也许有些读者会隐隐产生疑问：指出这两点究竟有什么意义呢？它们的意义将在后面进一步显现出来。

国内专家和媒体心目中“想当然”的影响因子公式

国内许多热爱“影响因子”的人士，长期从思想上对“影响因子”顶礼膜拜，但悲摧的是，他们却连自己热爱的对象是什么都没搞清楚！一个令人啼笑皆非的事实是：

长期以来，国内学者和媒体对“影响因子”计算公式的理解普遍是错误的。

例如，目前从“百度”上搜索对“影响因子”计算公式的表述，几乎全是错的。更多的例子表明，在这一轮对“影响因子”新的关注中，上述错误仍然保持不变，这里姑举近日见到的两例：

2016年6月20日《解放日报》题为《〈细胞研究〉跻身国际一流期刊》的报道中称：“影响因子是目前国际上通行的一项客观的期刊评价指标，即期刊前两年发表的论文在统计当年被引用的总次数除以该期刊在前两年内发表的论文总数。”

2016年7月12日《光明日报》上严蔚刚题为《科研评价应遵循什么基本原则——A类期刊与莱顿宣言、旧金山宣言的对话》的文章，谈到“影响因子”时称：“期刊影响因子是20世纪50年代由汤森路透公司开发出来的，……含义是某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。”

严文中的第一个错误这里就不必多说了：开发SCI和“影响因子”报告业务的是“科学情报研究所”（ISI）而不是汤森路透，ISI直到1992年才被汤森路透收购到旗下。不难看出的是，上面两例中对“影响因子”定义的理解同出一源（几乎就是“百度”上的文本）。而据《解放日报》记者告知，这个定义“是中科院的专家告诉我们的”。

正确的“影响因子”计算公式到底是怎样的？

其实“影响因子”计算公式每年都被表述在ISI发布的《期刊引证报告》（JCR报告）上，但是国内学者和媒体在谈到这个公式时，普遍不考察原初文本，只满足于人云亦云。这个公式的准确表述，当然应该以ISI每年发布的JCR报告上的文本为准：

一份期刊前两年中发表的“源刊文本”在当年度的总被引用数，除以该期刊在前两年所发表的“引用项”文章总篇数，即为该期刊当年度的影响因子数值。

用分数式表达就是：

按照ISI给出的定义，所谓“源刊文本”（source items），是指该SCI期刊发表的所有文本，而“源刊文本”又被区分为“引用项”（citable items）和“非引用项”（uncitable items），通常情况下，“引用项”对应学术文本，“非引用项”对应非学术文本。

需要特别注意，在上面的分数式中，分子部分的统计对象是期刊上所有文本——包括“引用项”和“非引用项”——所产生的全部引用次数；而分母部分的统计对象却只包括“引用项”的文章篇数。

对于长期习惯于在学术期刊上只刊登学术文本的中国人来说，将“源刊文本”区分成“引用项”和“非引用项”是没有意义的——在我们习惯的观念中，一本学术期刊的“源刊文本”数就是它的“引用项”数。所以对未曾深究过“影响因子”的人（包括许多科学家）来说，“百度”和上引权威报刊文章中对“影响因子”公式的错误理解，实属自然。

科学家们犯这种人云亦云的错误，或许情有可原——因为通常他们没有史学训练，而在他们的科学训练中，“考察原初文本”并不是一个得到强调的原则。就好比人们在应用万有引力理论时，通常并不需要去考察牛顿《自然哲学之数学原理》中的原初文本。

应该明确指出的是，国内对影响因子计算公式的表述普遍错误，而造成这种普遍错误的根本原因，则是因为在中国几乎不存在两栖化的期刊，所以影响因子计算公式的表述者们，都想当然地将分母中的“引用项”数等同于分子中的“源刊文本”数。也就是说，对于中国杂志而言，如果是学术杂志，那在绝大部分情况下，它的全部文本都是“引用项”，所以“源刊文本”数就等于“引用项”数；而如果它不是学术杂志，那它的“引用项”数就是零，因而也就不可能加入“影响因子”游戏了。

关于“影响因子”的合理性和公正性

ISI的“影响因子”计算公式，从提出到今天，中间曾有过修改。最初加菲尔德给出的定义，倒是和中国学者误解的形式相当接近：在公式中，分子部分包括期刊全部文本的全部引用，分母部分则是全部文本的篇数。唯一的区别只是，在中国学者的误解中，没有考虑西方某些期刊的两栖化——在中国学者的误解中，学术期刊“源刊文本”中的“非引用项”从来都是等于零的。

应该说，加菲尔德最初的“影响因子”计算公式还是比较合理的。所以也可以说，中国学者和媒体对“影响因子”计算公式的误解，实际上拔高了“影响因子”的合理性——尽管这未必是它的创始人真正追求的。

谁知才过了三年，到1975年，加菲尔德就修改了“影响因子”的定义，将计算公式改成了现在的形式——分子包括全部文本即“引用项”和“非引用项”的全部引用，而分母则只包括“引用项”的文章篇数。此外，公式中“两年期限”的合理性，多年来也在学术界备受质疑和争议，这些我已经在“影响因子”江湖故事的第一回中讨论过。

据说当初我指出“影响因子”背后的商业性质，已经严重伤害了那些“影响因子”崇拜者的感情，他们纷纷质问：商业化就必然不公正吗？其实，在揭示ISI和“影响因子”的商业性质时，我从未表示过“商业化就必然不公正”这样的意思——因为我并不这样认为。但这种质问背后却是有隐含逻辑的：

中国人普遍有“无商不奸”的传统观念——到底有多普遍也很难说，例如我就不持此种观念，而有些热爱“影响因子”的人士，看来却恰恰持有这种观念，所以他们一看到有人谈论影响因子的商业性质，就会认为影响因子的“清誉”受到了诋毁，或认为谈论者有诋毁影响因子“清誉”的企图，于是义愤磅礴而出。

然而，最近爆出的“影响因子”业务被汤森路透转卖的新闻，难道不是成百倍地伤害了那些“影响因子”崇拜者的感情吗？要知道，这已经是这项业务第三次被转卖了！一个被他们在精神上顶礼膜拜的东西，竟这样被人卖来卖去，真是情何以堪啊！

在SCI和“影响因子”这个游戏中，它的合理性及公正性，与它的商业性质之间，虽然并无表面上的必然联系，但确确实实有着内在的联系。理性的态度，当然不是愤然质问它商业性质的揭示者“商业化就必然不公正吗”，而应该先抛弃成见，先压抑一下对它顶礼膜拜的情怀，就事论事，考察它的规则到底公不公正，并进而认真思考到底什么是公正，而这正是我在这段学术江湖故事中想逐步告诉读者的。