本章主要介绍本书所使用的标杆测定法(对比差距法)在学术竞争力评估中的测度方式以及该方法在学术竞争力的硬评价及软评价中的具体应用。
本书对学术竞争力的评价采取标杆测定法。标杆测定法是一种评价绩效差异度的工具,主要用于测量自身与标杆对象之间各个绩效指标的差距,可以反映研究对象间的竞争力差距。该方法简单、实用,选择指标的灵活性强,不受指标类型和指标复杂度的限制,是实施标杆管理活动时普遍采用的方法之一。标杆测定法可以实现大学与大学的比较,即假定同类学科/领域中同等优秀的大学的一系列显性特征对学术竞争力具有明显的影响,因而可以通过比较一系列显性指标来评价大学之间在同类学科/领域学术竞争力上存在的差距。
标杆测定法的评价流程主要包括以下几个环节:①选取对标指标;②比较研究对象(群体或个体)在各指标上的差距;③进行综合汇总,评价研究对象之间的总体差距。此外,标杆对象的选择也是标杆测定法中的重要环节,一般需要遵循最优原则和相似性原则。本书不同章节对标所需的标杆学校选择方式有所不同,选择原则分述如下。
本书第二篇“大学分析”涉及大学联盟及顶尖大学的标杆选择。在第三章“中美一流大学联盟的学术竞争力分析”中,选择了两国具有较强国家代表性且联盟规模和办学模式比较接近的两个主体,即中国的“双一流”大学联盟和美国一流大学联盟(Association of American Universities, AAUs)。这两个联盟分别代表中美两国高等教育体系中一流大学的集合,将它们作为大学联盟的分析对象能使中美一流大学的学术竞争力研究具有较强的说服力。在第四章“中美顶尖大学学术竞争力案例分析”中,选择了中美一流大学联盟中表现突出的3所学校,选择标准参照QS世界大学排名(2019)。
在学科的学术竞争力评估部分,本书以教育部学科评估结果和美国QS学科排名为主要依据选取研究对象。有研究指出,入选一流学科的大学的选择依据以教育部学科评估结果为主,以QS学科排名和ESI学科排名为辅。因此,本书以教育部学科评估结果作为中国“双一流”大学研究对象的选择依据,入选标准为教育部公布的全国第四轮学科评估中对应学科等级为A(包括A+,A,A-)的前5名大学,若几所大学的学科评估结果同档,再参考国际QS学科排名(2019)和ESI学科排名(2019)确定最终研究对象;美国一流大学研究对象则选取美国QS学科排名(2019)排名前5名的大学。
在技术领域的学术竞争力评估部分,本书综合考虑大学的研究论文规模、专利规模和学科排名情况,分别选择5所研究领域和组织规模相近的中美大学作为研究对象。书中两个技术领域的标杆选择原则稍有不同:从学科角度来看,人工智能属于计算机学科的一个分支,因此在人工智能领域标杆选择中,除了参考论文规模和专利规模外,还参考了大学的计算机学科排名;而在量子信息领域标杆选择中,仅参考了论文规模和专利规模,在论文和专利规模均处于国际领先的中美大学中,各选择5所作为代表性大学。
在学术竞争力评估中,标杆测定法的实践应用价值在于通过对比找到差距。在实际分析中使用较多的标杆测定法主要有绝对差距分析法和比率分析法。绝对差距分析法通过将自身与标杆对象之间的实际绩效指标值做减法计算,得到各个指标真实的绩效差距,是从不同维度与标杆对象进行比较的一种有效方法;比率分析法通过将自身与标杆对象之间的实际绩效指标值做除法的百分比计算,得到各个指标的比率值。为比较中国“双一流”大学和美国一流大学的学术竞争力,本书综合运用两种方法进行差距的定量分析。如果将使用文献计量指标建立学术竞争力评估指标体系的方法定位为硬评价方法,那么对研究主题和研究领域的内容、学科布局、技术构成进行对比的方式则称为软评价方法,本书通过两者的有机结合,对大学的学术竞争力进行分析和评估。
学术竞争力的硬评价指标指用来评价学术竞争力所采用的标准或尺度。从评价学的观点来看,指标是一种具体的、可测量的、行为化的评价准则,是根据可测或具体化要求而确定的评价内容,通常指某一参数或某些参数导出的值。然而,没有任何一个单一的文献计量学指标能够全面评价学术研究的绩效。在学术评价的过程中,往往需要选择一组恰当的评价指标,以更为全面地洞察数据背后的内涵。因此,在实际的评价活动中,建立学术竞争力评价指标体系需要以现有的各项统计制度和数据为基础,指标的选择也要有数据的支持。在兼顾完善性与可操作性的基础上,本书建立了硬评价部分的指标体系(如表2-1所示)。该量化评估指标体系由4个一级评价维度和13个文献计量学指标构成。主要的文献计量指标的基本定义如下。
论文数:指在统计期内发表的研究型论文的数量。该指标是表征科研机构论文成果产出能力的主要指标。本书统计的论文发表年段均为2015—2019年。
发文增长率:指某一年份发文数的增量与前一年发文数的比值,以百分数表示。如2016年发文增长率=(2016发文数-2015发文数)/2015发文数×100%。5年平均增长率即5年发文增长率的平均值。
总被引次数:在统计期内发表的全部论文的被引用次数之和。该指标是测度科研机构论文总体影响力的重要指标之一。
h 5指数:源自 h 指数,意义为5年期间发表的全部论文集合的 h 指数。 h 指数指科研群体或机构发表的 n 篇论文中,至少有 h 篇论文且每篇论文至少被引 h 次。该指标用于定量评价科研人员或科研机构的学术成果,它鼓励科研人员或科研机构大量发表有影响力的成果而非进行低影响力的工作。与篇均被引次数相比, h 指数兼顾了科研产出规模(论文数)和科研影响力(被引次数),还能够规避一些极端现象,如避免单纯一篇高被引论文对一组论文评价的显著影响。
学科规范化的引文影响力(category normalized citation impact, CNCI):一种特殊的篇均被引次数,能够表征一组论文在学科层面上的相对影响力水平,即该组论文在每个学科发表论文中的实际被引次数与全球同学科同年同类型(article或review)论文的平均被引次数的比值之均值,常用以衡量科研质量。该指标一般以1.00为分界,大于1.00表示论文影响力高于全球平均水平,小于1.00则表示低于全球平均水平。CNCI排除了出版年、学科领域与文献类型的影响,可用于比较不同规模、不同学科混合的论文集的影响力。
影响因子期刊分区:本书中的期刊分区是指Journal Citation Reports分区(JCR分区)。JCR分区将期刊划分为176个Web of Science学科(WoS学科),每个学科的期刊按照当年的影响因子高低,根据期刊在所属学科中的排名( X )与该学科所有期刊数量( Y )的比值( Z )得出期刊的分区, Z ≤25%为Q1,25%< Z ≤50%为Q2,50%< Z ≤75%为Q3, Z >75%为Q4。JCR分区为四分位分区,每个分区的期刊数基本相等。JCR分区是一种规范化的影响因子划分方式。了解机构研究成果在各区期刊上的份额能从侧面评价机构成果的影响力。
Top期刊论文:在相应学科顶尖期刊上发表的论文数量,本书不同章节对顶尖期刊有不同的定义。对大学来说,顶尖期刊论文数被定义为在《自然》《科学》《细胞》及其子刊上的发文数量。对学科来说,根据期刊的5年影响因子、特征因子和当年发文量等指标综合专家评判结果,选出该学科的Top期刊,如临床医学Top期刊是指ESI临床医学5年影响因子排名前20且当年发文量≥100篇(文献类型为article和review)的期刊。其他学科和技术领域的Top期刊定义详见具体章节。
Top期刊论文占比(proportion of publications of top, PPTop):发表在Top期刊上的文献数除以全部文献数的值,以百分数的形式展现。
Top会议论文:人工智能领域采用了该指标,人工智能领域顶级学术会议选取标准主要参照全球顶级计算机科学机构排名(CS Rankings)的国际会议列表和中国计算机学会推荐的相关方向A类国际会议列表,并考虑了会议论文数据的可获取性和可对比性,最后共选定13种国际会议,并分析大学在这些会议上发表的论文。Top会议论文来源于Scopus数据库。
被引次数排名前1%的论文占比(proportion of publications of top1%, PPTop1%):指在某一指定学科领域、某一年、某种文献类型中,被引频次排名前1%的文献数除以该组文献全部论文数的值,以百分数的形式展现。通常情况下,该指标数值越大,表明该组文献表现越好。如果某组论文的该指标值等于1%,则该组论文中有1%的论文位于全球同类论文(同一学科、出版年和文献类型)被引次数排名的前1%,说明这组论文的水平与全球平均水平相当。PPTop1%通常被认为是反映高水平科研的指标,因为只有那些高被引论文才能进入相应的学科领域、出版年与文献类型排名的前1%。
被引次数排名前10%的论文占比(proportion of publications of top 10%, PPTop10%):指在某一指定学科领域、某一年、某种文献类型中,总被引次数排名前10%的文献数除以该组文献全部论文数的值,以百分数的形式展现。通常,该指标数值越大,表明该组文献表现越好。PPTop10%与PPTop1%相比,只是将被引次数排名的阈值从1%变为10%。两个指标互相补充,可以提供更为宽泛的优秀科研(10%)与杰出科研(1%)的全景评价。
CNS及其子刊论文:CNS是指世界公认的《自然》《科学》《细胞》这三大最权威、最具影响力的学术期刊。这三大刊各自所属的出版集团还出版其他多种子刊。《细胞》是爱思唯尔出版公司旗下的细胞出版社(Cell Press)出版的关于生命科学领域的期刊,偏向基础研究,它刊登过许多重大的生命科学领域的研究进展。除《细胞》外,细胞出版社还出版40多种子刊。《自然》的出版机构为斯普林格自然出版集团(Springer Nature),该机构除出版《自然》这一主刊外,旗下还有50多种子刊。《科学》由美国科学促进会(American Association for the Advancement of Science, AAAS)出版,AAAS旗下另有多种子刊。CNS及其子刊论文即指发表在这100余种期刊上的论文。
国际合作率:国际合作论文是指由2个或者2个以上国家(地区)的作者共同参与合作发表的论文。国际合作率即指国际合作论文数占全部论文数的百分比。国际合作率体现了学者或机构吸引国际合作的能力。一般来说,国际合作率越高,研究成果国际合作程度也越高。
校企(横向)合作率:指校企(横向)合作论文数占全部论文数的百分比。横向合作论文指那些包含了一位或多位组织机构类型标记为“企业”的作者的论文。
本书除采用表2-1中包含的主要指标表征学术竞争力外,还采用了一些用于表征机构学术竞争力的评价指标,这些指标的具体定义如下。
篇均被引:一组文献的总被引频次除以该组文献总数。篇均被引展现了该组文献中每一篇文献获得的平均引用次数。
平均百分位:一篇论文的百分位是通过建立同出版年、同学科领域、同文献类型的所有出版物的被引次数分布(将论文按照被引用次数降序排列),并确定低于该论文被引次数的论文的百分比获得的。如果一篇论文的百分位值为1,则该学科领域同出版年、同文献类型中99%的论文的被引次数都低于该论文。对于一组论文来说,平均百分位可以通过计算该组论文中所有论文百分位的平均值获得。
论文被引百分比:是一组论文中至少被引用过一次的论文占总论文数的百分比。这个指标揭示了某科研领域其他科研工作者引用本机构科研成果的程度。
5年影响因子:计算方式为某期刊在前5年发表的论文在第6年的总被引次数除以该期刊在前5年发表的论文总数。5年影响因子将期刊的评价时间跨度从2年延长至5年,反映了期刊的长期被引情况和平均水准。
期刊特征因子(eigenfactor scores):以过去5年Web of Science收录期刊发表的论文在第6年被引次数为基础计算,同时考虑在期刊网络中引文较多的期刊的贡献。与期刊影响因子不同,期刊特征因子的基本假设是目标期刊如果高学术影响力的期刊引用次数越多,则该被引期刊的学术影响力越高。期刊特征因子不仅考察了引文的数量,而且考虑了施引期刊的学术影响力,更好地体现了顶级期刊的学术水平,同时在一定程度上减弱了期刊自引的影响。期刊特征因子将“引文质量”纳入测评范围,用以评价期刊的重要性。
Top高被引论文:学科归一化之后的高被引论文。本书分别按照被引次数排名的学科领域百分位数值来确定被引次数排名前1%的论文和被引次数排名前10%的论文,两者对应的相对计量指标分别为被引次数排名前1%的论文占比和被引次数排名前10%的论文占比。其中,学科领域百分位数指标是指该机构论文在全球该学科当年发表的论文中按被引频次排名的百分位数,是基于论文出版年、学科和出版类型三者同时进行被引次数归一化的一种指标。该指标的量纲为百分数,数值等于1表示该组论文在全球各学科领域中平均排名在全球前1%。
国际合作贡献:国际合作论文中以第一单位或通讯单位身份参与国际合作论文发表的情况。论文的第一单位一般是对该论文做出最大贡献的单位。通讯作者单位一般是在研究中起主导作用的学者单位。本书只考虑一般情况下的第一单位和通讯单位,不对多个作者等同贡献、作者排名不分先后等特殊情况进行区分。
归一化论文数:由于各研究对象的发文数差别较大,为了便于将发文数在不同量级的研究对象放在一起对比,本书中有些图采用了归一化论文数。归一化论文数的计算方法为:某校论文数/论文数最少的学校的论文数。
学科标准化论文影响力(field-weighted citation impact, FWCI):SciVal平台中的文献计量指标,与学科规范化的引文影响力类似,用来衡量文献是否达到全球同类文献平均水平。FWCI是考察机构、国家、学者等的论文影响力的指标,计算论文的被引用次数与相同学科、相同年份、相同类型论文平均被引次数的比值,排除了出版年、学科领域和文献类型的影响。FWCI=1,说明论文质量等于全球平均水平;FWCI>1,说明论文质量高于全球平均水平;FWCI<1,则说明论文质量低于全球平均水平。
本书的技术领域学术竞争力分析部分还通过分析专利情况对标中美顶尖大学技术创新实力和潜力,相关专利指标的具体定义如下。
专利数:专利公开一般比专利申请滞后6~18个月,为使2019年专利数据具有参考性,本书统计的专利数是指在统计期内公开的专利文件的数量。该指标是表征科研机构专利成果产出能力的主要指标。
国际申请数:在统计期内公开的专利文件中通过世界知识产权组织登记的国际申请数(即PCT专利申请,可以在多个国家进行专利申请,标WO专利号)。国际申请数考察的是机构对国际市场的重视程度和机构专利在国际市场的竞争力。
高分专利数:在统计期内公开的专利文件中专利强度为6~10的专利文件数量。专利强度(patent strength)是Innography专利评价指标,其作用是帮助用户快速有效地寻找核心专利。专利强度参考了专利价值的十余个相关指标,包括专利权利要求数量(patent claim)、引用先前技术文献数量(prior art citations made)、专利被引用次数(citations received)、专利及专利申请案的家族(families of applications and patents)、专利申请时程(prosecution length)、专利年龄(patent age)、专利诉讼(patent litigation)、其他(others)。
授权专利数:在统计期内公开的专利文件中授权专利文件的数量。由于2015—2019年公开的专利文件,其申请年份并不对应2015—2019年,因此统计的授权专利数仅供数量上的对比参考,不适用于授权率的计算和比较。
学术竞争力的软评价包括对研究主题和研究领域的内容、学科布局、技术构成。学科布局分析是明确大学学科发展特征的重要分析维度,主要包括以数据库学科分类为基础的学科布局分析和以研究领域为基础的主题分析。在衡量大学的学术研究水平时,以研究领域为基础的主题分析方法被广泛采用,这是一种科学活动的中水平(meso-level)分析,非常适合捕捉科学活动中质的变化。映射研究领域(research area)是进行领域研究的首要工作,需要充分利用文献共引及由其延伸出来的词的共引、著者共引、期刊共引、主题共引等一系列共引关系。本部分涉及的相关方法说明如下。
研究主题(topics):是基于SciVal平台1996年至今的科研数据,通过文献的引用关系,聚类分析得到的。全科学领域约有9.6万个研究主题。每个研究主题的命名形式都为“主题词、主题词、特征词”。此处的主题词是利用指纹技术(Elsevier Fingerprint Technology, EFT)确定的该领域的高频词,可以表现该主题的研究领域或者专业方向;特征词则是摘选自该主题的特殊短语,对该主题在研究问题层次上提供具体的描述。
主题集群(topic clusters):将具有相似研究兴趣的主题聚合在一起,形成一个更广泛、更高层次的研究领域。这些主题集群可用于更广泛地了解一个国家、机构(或团体)或研究人员(或团体)正在进行的研究,然后深入研究更小范围的基础主题。主题集群是使用与创建研究主题相同的直接引用算法形成的。当研究主题之间的引用链接强度达到阈值时,即可形成主题集群。
优势研究主题(key topics):如果在某研究主题上,某个机构的发文量达到了发文量排名第一机构的1/3,或者被引次数达到了被引次数排名第一机构的1/3,就被认为是某个研究主题的关键贡献者。作为关键贡献者参与的主题可被视为该机构的优势研究主题。
主题显著度(prominence percentile):综合考虑了最近引用数量、最近浏览数量和期刊CiteScore 3个参数,对每个主题 j 在第 n 年的显著度为 P j ,计算公式为 P j =0.495[ C j -Mean( C ) j ]/Stdev( C ) j +0.391[ V j -Mean( V ) j ]/Stdev( V j )+0.1149[ CS j -Mean( CS j )]/Stdev( CS j )。其中, C j 是主题 j 中的第 n 年和 n -1年发表论文的引用量, V j 是主题 j 中的第 n 年和 n -1年发表论文的Scopus浏览量, CS j 是主题 j 中的第 n 年和 n -1年发表论文的平均CiteScore,其中原始数据经过了对数转换,即 C j =ln( C j +1), V j =ln( V j +1), CS j =ln( CS j +1)。显著度计算是用标准化分数消除3个指标之间的量纲差异,再对每个主题近2年论文的引用数量、浏览数量、期刊评价指数与平均值的离散程度加权求和。因此,主题显著度越高,表示关注这个主题的研究者越多,也说明这个主题的增长势头越猛。实际使用中,SciVal根据主题显著度数值排序,计算每个主题的百分位数指标。
共引分析法:通过文献之间引用、共现分析,直观地揭示出文献计量单元之间的内在联系,展示研究对象的发展状态。
聚类分析:数据挖掘中非常重要的挖掘方法,常见的有划分法、密度算法、图论聚类法等。聚类是将物理或抽象对象进行分组,并将相似的对象聚为一类的过程,主要思想是在同一类中的对象相似性较大,不同类中的对象差异性较大。 K 均值聚类算法( K -means clustering algorithm, K -means算法)是一种非常经典的基于划分的聚类算法, K -means算法的公式如下:V= 。 K -means算法的具体实现步骤为:第一步,在数据集中随机选取 k 个对象作为初始聚类中心;第二步,计算每个对象到初始聚类中心的距离,将每个对象分配给离它最近的聚类中心;第三步,根据第二步得到新的 k 类数据,计算新的聚类中心;第四步,重复第二步、第三步,直至标准测度函数开始收敛,即聚类中心不再变化为止。这种聚类方法操作简单、高效,并且能够使得类内尽可能紧凑,而类间尽可能分开。基于此,本书通过热力图对聚类分析的结果进行可视化展示,热力图以WoS学科为纵坐标,10所顶尖大学为横坐标,横纵坐标交叉的区域代表大学在该学科的发文量,聚类颜色越深,说明该校在该学科发文量越多。结合热力图中各大学与学科的聚类分布结果,可进一步挖掘出每种聚类中大学的学科结构特征。
波士顿矩阵(Boston consulting group matrix):又称四象限分析法,是一种对事物属性进行组合细分的分析方法,由美国著名的管理学家、波士顿咨询公司创始人Bruce Henderson于1970年首创,最先用于公司层面战略规划,通过业务优化组合实现企业现金流量平衡。在选择某一具体发展领域的发展路径时,通常可以选择波士顿矩阵作为战略管理和决策的多维度分析工具。本书将波士顿矩阵延伸用于揭示大学学术竞争力,将市场增长率和市场份额两种业务指标替换为研究规模和研究影响力,用以衡量大学学术竞争力,并以这两个指标的平均值作为四个象限的分割线,将大学分为“优势”、“机遇”、“劣势”和“挑战”四类。如图2-1所示,每个象限中的大学具有不同的竞争优势与劣势,例如大学A,处于第一象限,属于“优势”大学,在研究规模和研究影响力均表现优异。通过四象限图,可以直观地观察到各所大学所处的位置,实现对不同大学之间学术发展竞争力的比较。
专利技术构成:具体指专利数排名靠前(如排名前20)的国际专利分类(international patent classification, IPC)。通过专利技术构成分析可以了解研究对象专利申请的密集点,找出核心技术分支;还可以评估技术研发集中度,判断分析对象的技术研发和专利布局侧重点。
本书在大学分析部分采用硬评价与软评价相结合的方法。硬评价部分通过文献计量学指标评价学术研究的绩效,数据来源于Web of Science核心合集和InCites平台;软评价部分梳理了大学各自的学科布局及其差异,数据来源于Scopus数据库和SciVal平台,采用ASJC(all science journals classification)学科分类。
学科的学术竞争力主要表现为科学研究竞争力,而论文一直是公认的最为主要的科学研究成果,在反映学术竞争力方面具有独特的优势和较强的代表性。因此,本书学科分析部分的结果均基于论文的学术竞争力产生。论文的学术竞争力水平由硬评价的量化指标测度和软评价的非量化指标结果分析组成。其中,硬评价量化指标数据来源于InCites数据库,采用ESI学科分类体系;软评价非量化指标数据来源于SciVal数据库,采用QS学科分类体系。
技术领域部分分别以论文和专利来反映研究对象的科学研究和技术创新两方面的竞争力。数据准备是分析的基础和重点,由于技术领域的论文数据集无法通过学科分类获取,因此采用主题检索的方式获得。关键词选择是否完备,检索式构建是否合理,对分析结果的准确性和可信度具有至关重要的影响。因此,本书针对不同领域的特点,使用了多种方式确定检索词,如阅读该领域综述类和关键文献;选择代表性机构发表的文献、该领域高品质期刊的文献、领域代表性人物的文献,进行关键词聚类,提取高频词;利用多个数据库的趋势分析功能,分析该领域的高频关键词。在此基础上采取专家咨询法,请各领域专家审阅选取的关键词和检索后的分析结果,并根据专家反馈意见及时进行调整,确保检索结果能更为准确地反映该领域的真实情况。技术领域的专利集合采用主题检索与专利分类号检索相结合的方式获取。论文数据来源于Web of Science核心合集和Scopus数据库,专利数据来源于Innography数据库和IncoPat平台。