购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.1 学术网络资源利用

中文社会科学引文索引(CSSCI)是国内最权威的索引数据库之一,其遴选期刊的标准兼顾了影响因子与同行评议多重指标,索引期刊具有相对较高的内容和引文标引质量。据此,选取CSSCI数据库1998—2017年收录的1001069篇学术论文作为样本,利用Excel和SPSS统计分析工具对数据进行分析,研究我国人文社会科学领域对学术网络资源的引用情况。CSSCI历年的学科分类存在细微差别,合并与统一后,共覆盖了25个人文社会科学类别,鉴于“综合性社科期刊”与“高校综合性学报”两个类别包含多个学科内容,无法界定具体学科,仅保留除上述两个之外的23个学科(表3-1)。相关分析包括四方面:(1)整体分析,将人文社会科学领域的所有学科、所有年份的论文视为整体,从宏观层面探索我国人文社会科学领域学者对学术网络资源的利用情况;(2)学科差异,根据CSSCI的学科分类体系,在微观层面探讨不同学科的学者对学术网络资源利用偏好的差异;(3)年度变化趋势,以每年收录的论文为单位,探讨1998—2017年二十年间我国人文社会科学领域学者对网络学术资源利用的变化趋势;(4)一流期刊对网络学术资源的利用情况,将南京大学2017年评选出的31种文科一流期刊作为高质量期刊(表3-2),探究一流期刊与非一流期刊在利用学术网络资源方面的异同。

表3-1 CSSCI的23个学科类别

表3-2 南京大学文科一流期刊列表(2017年版)

续 表

3.1.1 资源总体利用情况

(1)概貌

如表3-3所示,获取的含引文论文数(a)共1001069篇,包含引文(C)13806269条,篇均引文量(C/a)为13.79。其中,包含网络引文的论文(Wa)195081篇,网络引文(W)610335条,篇均网络引文量(W/a)为0.61条,网络引文在引文总量中的占比(W/C)为4.42%,包含网络引文的论文在论文总量中的占比(Wa/a)为19.49%。此结果有别于Sadat-Moosavi等人 以及丁敬达、杨思洛 对图情领域的研究结论,表明相对于图情领域,我国人文社会科学领域整体引用网络资源的比例较低。

表3-3 网络引文情况的总体描述

续 表

(2)学科差异

由表3-3可知,23个学科类别在多项指标上具有差异,如篇均网络引文量。为了进一步说明不同期刊刊载论文对网络引文的利用程度,借鉴吴淑娟等 的研究方法对网络资源的利用情况进行研究。为消除学科间引文数量总体差异对研究结果的影响,研究以网络引文在引文总量中的占比(W/C)为对象,探究不同学科间的差异。

首先,考察数据的正态性与方差同质性,基于Kolmogorov-Smirnov检验说明数据不符合正态分布(p<0.001)。因此,基于Kruskal-Wallis检验考察不同学科W/C的显著性差异,结果如表3-4所示,卡方统计量为69778.083,p值小于0.001,拒绝原假设,表明各学科的W/C具有显著性差异。结合各学科W/C的均值(图3-1),可将23个学科分为三个级别:

第一等级学科引用较多网络资源,包括图情、新传、政治学、教育学等4个学科,W/C大于8%,显著高于其他学科;

第二等级学科引用网络资源的等级中等,包括法学、艺术学、马克思主义等9个学科,W/C为2%—5%;

第三等级学科较少引用网络资源,包括心理学、考古学、历史学等10个学科,W/C小于2%。

表3-4 学科间W/C的Kruskal-Wallis检验结果

图3-1 23个学科W/C数据的均值

(3)年度变化

1998—2017年CSSCI收录的来自23个人文社会科学领域论文的网络引文占比年度分布如表3-5和图3-2所示。网络引文数(W)、网络引文在引文总量中的占比(W/C)、包含网络引文的论文在论文总量中的占比(Wa/a)以及篇均网络引文量(W/a)表现出增长态势,其中W/a和Wa/a增长较为明显,W/a从0.01增长至1.17,Wa/a从0.29%攀升至28.85%。由网络引文年度分布情况可知,学术网络资源对人文社科领域学术研究具有重要意义。同时,剔除掉年度发文量和单篇引文量的影响,以考察学术网络资源利用情况的年度变化规律,本节选取W/C这一指标进行研究。

表3-5 网络引文年度分布情况

图3-2 W/a、W/C、Wa/a三个指标的年度变化图

鉴于W/C不符合正态分布,在考察各年度的W/C是否存在显著性差异时采用非参数统计中的Kruskal-Wallis检验。结果如表3-6所示,卡方统计量为40057.581,p值小于0.001,拒绝原假设,说明各年度的W/C具有显著性差异。同时,结合图3-2年度W/C数据的均值图得到如下结论:

①依据增长趋势,以2005年为界限,1998—2017年可分为快速增长和平稳增长两个阶段;

②1998—2005年W/C快速增长,呈现指数增长趋势;

③2005—2017年W/C增长速度放缓,呈现近线性增长的平稳趋势。

表3-6 不同年度W/C的Kruskal-Wallis检验结果

(4)一流期刊

在1001069篇目标文献中,属于一流期刊的论文共65254篇,占总量的6.5%(表3-7)。与其他期刊相比,一流期刊篇均引文量(C/a)相对较高,但篇均网络引文量(W/a)、网络引文在引文总量中的占比(W/C)以及包含网络引文的论文在论文总量中的占比(Wa/a)三个指标较低,表明一流期刊论文引用网络资源较少。鉴于W/C的非正态分布性质,对一流期刊与非一流期刊两组数据W/C的U检验结果表明,两组数据的W/C存在显著差异,即一流期刊的显著小于非一流期刊的(表3-7)。

表3-7 一流期刊与非一流期刊W/C的曼-惠特尼U检验结果

3.1.2 来源网站类型

(1)概貌

常见学术相关网站可按域名分为7类:.com(工商企业)、.org(非营利组织)、.net(网络机构)、.edu(教育机构)、.gov(政府)、.ac(学术机构)、.int(国际组织)。 分析23个学科在1998—2017年各类型网站的引文数据,得到不同类型网站引文出现的频次如图3-3所示。出现频率最高的网站类型是工商企业类(.com),其频次约为其他6类网站出现频次的总和;非营利组织(.org)与政府(.gov)网站出现的频率位于第二、第三;其余4类网站出现的频率相对较低。

该结果与中国互联网信息中心发布的《第36次中国互联网络发展状况调查统计报告》 中的中国域名分类统计结果(.com>.net>.ac>.org)存在较大差异,说明各类型的网站所提供资源的学术价值和被认可程度具有一定差异。从已有学术研究成果看,本结论也有别于针对图书情报领域网络引文的研究结果,.org>.com>.edu>.gov(2005—2010年) 和.com>.edu>.org>.gov(2007—2011年) ,其表现为.com(工商企业)网站引用比例有所上升,反映了我国人文社会科学领域研究正呈现出与市场相贴合的趋势;同时.org(非营利组织)与.edu(教育机构)类网站的比例有所下降,反映了单一学科与总体的差异。

图3-3 各类型网站引文出现的频次

(2)学科差异

以引用了网络资源的195081篇论文为分析目标,探究上述7类网站的网络资源在总网络引文量中的占比在不同学科的差异。Kolmogorov-Smirnov检验说明不同类型网络资源占比分布不符合正态分布(p<0.001),因此,采用Kruskal-Wallis检验分析各组别的差异。Kruskal-Wallis结果表明23个学科引用7种网络资源在网络引文总量中的比例存在显著差异(p<0.001,表3-8),结合学科该比例在不同学科的均值可见(图3-4):

①工商企业类网站(.com)的比例在除环境科学和考古学两个学科外均为最高,显著高于其他6类网站;

②非营利组织类网站(.org)在各学科中的比例均较高,在多数学科中位列第二位或第三位;

③政府类网站(.gov)在多数学科中的比例较高,且在环境科学、社会学、人文地理三个学科中的比例明显高于其他学科。

④教育机构类网站(.edu)在部分学科中的比例显著高于其他学科,比如教育学、心理学、哲学、语言学等。

表3-8 学科间7类网站引文比例的Kruskal-Wallis检验结果

图3-4 23个学科引用7类网站引文的比例

(3)年度变化

1998—2017年,7类网站资源占总网络资源的比例产生了显著变化。如图3-5所示,工商企业类网站(.com)在1998—1999年呈现快速增长趋势,在2000—2017年仍保持稳定增长。截至2017年,该类网站比例从1998年的5%左右增长至38.80%,展现出了我国人文社会科学领域对该类网站资源的认可以及逐渐与市场贴合的趋势。政府类网站(.gov)在1998—2017年稳步增长,增长幅度约为10%,体现出人文社会科学领域对政府类网络信息资源的需求持续走高。非营利组织(.org)与国际组织(.int)均表现出先增长后维持不变的趋势,而其余三类网站(.edu、.net、.ac)则表现出先增长、后下降的“昙花一现”模式。

图3-5 7类网站引文占比的年度变化

(4)一流期刊特征

一流期刊与非一流期刊对7种不同类型网站引用的占比的曼-惠特尼U检验如表3-9所示。结果表明,两组数据在引用网络机构(.net)类网站的比例不存在显著差异,引用其他6种类网站的比例存在显著差异。结合引用比例的均值可知,一流期刊引用非营利组织(.org)、教育(.edu)、学术(.ac)及国际组织(.int)4类网站的比例比非一流期刊高,而引用工商企业(.com)与政府类(.gov)网站的比例较低。

表3-9 一流期刊与非一流期刊对7种不同类型网站引用的占比的曼-惠特尼U检验

续 表

3.1.3 来源地区分布

(1)整体概貌

除中国大陆域名(.cn)和国际域名(如.com、.net)外,网络引文中还存在其他国家或地区的域名,基于一项针对2010—2012年图书情报领域高被引域名分布研究 ,以该研究前十位的国家或地区域名为研究对象,分析不同来源国家或地区引文间的利用差异以及变动情况。统计这十个国家或地区的网络引文频次,如图3-6所示,网络引文中来自英国的网站数量高达23061,明显高于其他九个国家或地区;来自日本、澳大利亚、德国、加拿大四个国家以及我国台湾地区的网络引文数量较高,而来自其余四个国家或地区的网络引文数量较低。

图3-6 来源于十个国家或地区的网络引文频次

(2)学科差异

Kruskal-Wallis分析结果表明(表3-10)来自十个不同国家或地区的网络资源占网络引文总数的比例在不同学科之间的分布存在较大差异(p<0.001),结合学科引用的不同国家或地区的比例均值图(图3-7)可知:

①来源于英国的引文在除考古学、环境科学、统计学外的其他学科,均为占比最高的网站域名所在国家或地区;

②来源于日本的引文占比分布具有较大的学科差异,表现为在统计学、民族学等近半数学科中占比较高,占全部网络引文的比例位于前三名;而在教育学、语言学、考古学、心理学、图情等学科中的排名较为靠后;

③来源于不同国家或地区的引文比例在考古学与环境科学两个学科的分布,与其他学科存在较大差异,表现为上述两个学科较多引用来自我国台湾和我国香港等地区的网络资源,而较少引用来自英国等欧美国家的网络资源。

图3-7 来自十个国家或地区的网络引文占比在23个学科的分布

表3-10 来源于十个国家引文占比的学科Kruskal-Wallis检验结果

续 表

(3)年度变化

来自不同国家或地区的引文占比在1998—2017年的变化情况如图3-8所示,根据年度变化模式,可将来源于十个国家或地区的网络引文占网络引文总量的比例分为四类:

图3-8 来源于十个国家或地区引文占比的年度变化

①先上升后下降、最终维持稳定模式,包括来源于英国、日本、加拿大、法国四个国家及我国台湾地区的引文占比;

②波动下降模式,包括来源于澳大利亚与美国两个国家的引文占比;

③相对稳定模式,在特定值附近波动变化,包括来源于我国香港地区以及意大利的引文占比;

④波动上升模式,仅来源于德国的引文占比呈现出该模式。

(4)一流期刊特征

一流期刊与非一流期刊对来源于十个不同国家或地区网络资源的引用的占比如表3-11所示。曼-惠特尼U检验结果表明,两组数据在引用来源于我国台湾(.tw)、澳大利亚(.au)、我国香港(.hk)、美国(.us)及日本(.jp)5个国家或地区网站的比例不存在显著差异,引用来自其他5个国家网站的比例存在显著差异。结合引用比例的均值可知,一流期刊引用来源于英国(.uk)、德国(.de)、加拿大(.ca)、法国(.fr)及意大利(.it)5个国家网站的比例显著高于非一流期刊。

表3-11 一流期刊与非一流期刊引用不同国家或地区比例的曼-惠特尼U检验

3.1.4 资源利用深度

(1)概貌

统一资源定位符(Uniform Resource Locator,URL)是对可以从互联网上得到的资源的位置和访问方法的一种简洁表示。 Yang等 指出,URL的深度可以通过“/”在URL中出现的次数进行度量,其中,每增加一个“/”,URL的深度加1。而学者对学术网络资源的利用深度可以通过被引URL的深度进行反映。 因此,统计分析网络引文数据样本的URL深度,旨在探究我国人文社科学者对学术网络资源的利用深度。引文URL深度总体分布情况如图3-9所示,由图可知,统计样本的URL深度分布于0—21,其中URL深度为3、4和5的引文最多,URL深度为10及以后的引文极少,表明我国人文社会科学领域学者较多使用浅层URL网络资源。

图3-9 引文URL深度总体分布情况

(2)学科差异

鉴于网络引文URL深度的偏态分布,采用Kruskal-Wallis检验比较其在学科间的差异。分析结果表明不同学科之间引用的网络资源深度存在显著差异(p<0.001,表3-12),结合学科的网络深度均值图(图3-10)可知:

①教育学、政治学、外国文学、环境科学、法学、图情等6个学科引用的网络资源平均深度较大;

②考古学引用网络资源平均深度最小,明显小于其余学科,经济学与中国文学的网络资源引文平均深度也较小。

表3-12 引文URL深度的学科Kruskal-Wallis分析结果

图3-10 23个学科引文URL深度的均值

(3)年度变化

如图3-11所示,1998—2017年,网络引文URL深度的均值整体呈现明显的上升趋势,依据增长幅度可将相关年份划分为三个阶段:

①快速增长阶段。1998—2000年,我国人文社会科学领域学者引用网络资源的URL平均深度成倍增加,到2000年年底,网络引文URL平均深度由0.82增长至2.55;

②波动阶段。2000—2003年,我国人文社会科学领域学者引用网络资源的URL平均深度小幅度下降,维持在2.20附近;

③稳定增长阶段。2003—2017年,我国人文社会科学领域学者引用网络资源的URL平均深度恢复增长,平均每年增长约0.15个深度。

图3-11 网络引文URL深度年度变化趋势

(4)一流期刊

一流期刊与非一流期刊网络引文URL平均深度如表3-13所示。曼-惠特尼U检验结果表明,两组数据在引用的网络资源深度上不存在显著差异,即一流期刊与非一流期刊网络引文的平均深度相同。

表3-13 一流期刊与非一流期刊网络引文URL深度曼-惠特尼U检验

3.1.5 小结

本部分以1998—2017年收录于CSSCI数据库的学术论文及其引文为数据,基于引文分析方法揭示大数据时代我国人文社会科学领域学者对学术网络资源利用的状况与总体趋势。总体来看,我国人文社会科学领域学者对学术网络资源利用的意识有所提升,引用网络资源的比例大幅增加。首先,网络引文数、网络引文在引文总量中的占比、含网络引文的论文在论文总量中的比例等指标均表现出增长态势,篇均网络引文量从0.01增长至1.17附近,包含网络引文的论文在论文总量中的占比从0.29%攀升至28.85%。据此,我国人文社会科学领域学者对学术网络资源的认可程度在一定程度上有所提升。可以预知的是,在学术网络资源增长和资源获取成本降低的大数据环境下,学者对学术资源的获取与利用行为、习惯已发生一系列变化,而这一变化将随着资源数字化浪潮愈加深刻。但是,必须承认,正如一枚硬币的正反两面,大数据既是机遇又是挑战,在资源深度融合的同时也会造成学术网络资源的认知超载,甚至导致信息迷航,使得科研工作无法顺利进行。其次,学科间对学术网络资源的利用呈现出明显的差异,图情、新传、政治学与教育学四个学科中网络引文的占比超过8%,特别在图情学科,这一比例超过了13%;而考古学和心理学两个学科的网络引文占比不足1%。据此,建设与开展面向学科领域、服务科研活动的学术网络资源深度聚合与服务,以提高学术资源获取的便利性;充分把握大数据环境下科研工作者对学术网络资源的利用偏好与特征,以提高学术资源获取的精准性。最后,一流期刊对学术网络资源的引用比例低于非一流期刊,表明高质量学术期刊对学术网络资源的认可度相对较低。

针对引用了学术网络资源的论文开展进一步的分析,发现近年来我国人文社会科学领域学者的学术网络资源利用行为具有以下特征。

从网站类型出发,我国人文社会科学领域学者,对不同类型的网站提供的学术网络资源在利用上具有一定的选择性。研究发现,各类型网站提供的资源在学术性、利用价值、可获取性和研究者偏好上存在差异,整体上讲,工商企业类、非营利组织类和政府类等非学术类网站资源对人文社会科学领域的研究具有重要意义。这在一定程度上反映了我国人文社会科学领域学者在研究过程中愈加重视产业资讯、行业数据与政策法规的价值,同时也愈加契合市场热点。然而,上述特征在不同学科和等级的期刊中略有差异,例如教育类网站在教育学、心理学等相关学科中被引用的比例显著较高;一流期刊引用非营利组织、教育、学术类网站的比例更高等。据此,在聚合网络资源时,既要兼顾传统的学术类与非学术类的网站资源,又要考虑学科差异。

从资源来源地区出发,除了中国大陆地区网站的资源,其他国家或地区的网站资源也大量出现在我国人文社会科学学者的研究中,说明学者对外文资源的利用意识与能力有所提升。整体来看,英国网站资源被引频次显著高于其他国家或地区。近年来,我国人文社会科学领域学者对来自除德国外的其余九个国家或地区学术网络资源的引用,表现为稳定或波动下降的趋势,对来源于德国的学术网络资源的利用小幅增长。不同学科的学者对来源于十个国家或地区的学术网络信息资源偏好存在差异,多数学科更多引用来自英国等欧美国家的网络资源,而考古学与环境科学两个学科则表现出对我国香港和台湾地区学术网络资源的偏爱。在期刊质量方面,与普通期刊相比,一流期刊表现出偏向引用来自英国、德国、加拿大等发达欧美国家学术网络资源。据此,从时间变化与学科差异角度,建议网络信息资源的聚合采用动态的视角,横向与纵向评估同时进行,以为来源于不同国家或地区的网站赋予不同权重,从而更好地服务于我国人文社会科学领域科研事业的发展。

从资源利用深度出发,近年来,URL深度仍保持稳步增长,说明人文社会科学学者对学术网络资源探索和利用深度逐步提高。同时,深度超过10的学术网络资源被学者引用的概率较低,据此,在聚合时需要重视相关网站主机的子目录资源,及时根据需求调整网络资源深度。学术网络资源的URL深度在一流期刊与非一流期刊之间不存在显著差异,不同学科之间的差异也相对较小。 MSvblbgD6wwCKfajlb4COBHPuMAPk0X5ysKdhePF6VGMWiAt9qBkItkrB7yIWK9T

点击中间区域
呼出菜单
上一章
目录
下一章
×