本研究旨在探讨中国体育赛事理论研究的历史演进和理论构建问题,以揭示中国体育赛事理论发展的内在规律和体系结构,刻画体育赛事概念间的关系,并探讨中国体育赛事理论体系的构建。依据各部分研究内容之间的逻辑关系,本研究将遵循图1-1所示的技术路线。
图1-1研究技术路线图
本研究采取计量学的方法,定量地对文献资料的研究前沿热点、文献数量及时区特征、期刊载文量、机构分布等进行统计分析,最大化表征相关文献的知识图谱所载信息。
1.知识图谱的基本理论
(1)知识图谱的发展
管理科学与工程主要包括六个学科域,分别是管理科学(狭义)和决策科学、系统工程、工业工程、信息管理与信息系统、工程管理和科技管理(科学学与科学管理)等。其中,科学学与科学管理又包括科学能力学、科研管理学、制度科学学、科学体系学和科学计量学等分支学科。而作为科技史和科学学与科技管理重要分支的科学计量学,它是一门对科学(理论)本身及其产生、传播与利用的量的规律性进行定量研究的学科,它起源于科学学领域中有关科技政策的定量研究,主要集中于对科学(理论)多元化和多样性的定量测度,以及对不同国家、地区和机构的科研能力进行应用研究。由于历史的原因和视角的差异,不同学科专业领域的科研工作者使用了不同的名称来定义这一研究领域,实际上,文献计量学、信息计量学和技术计量学等是一门学科,都是科学计量学。最早对科学的计量研究,始于100多年前自然科学家包括Candolle,Galton,Eales,Hulme和Lotka等对科学(理论)发展的统计分析,他们的研究发现了著名的洛特卡定律、布拉德福定律和齐普夫定律。20世纪60—70年代,科学的计量研究开始成为一门科学,引文分析开始盛行,统计、矩阵和图论等数学工具和计算机技术不断被引入该领域,在此基础上,“科学计量学”这一学科术语正式诞生,这一领域中具有奠基性贡献的学者包括Price,Garfield、纳利莫夫和穆利钦科等。20世纪80—90年代,科学计量学开始从“小科学计量学”向“大科学计量学”形态迈进,出现了多样化的研究层面和子领域,共现分析开始盛行。进入21世纪以后,研究者们将应用数学、图形学、信息科学等学科理论和信息可视化技术等方法,与传统科学计量学共现分析方法相结合,诞生了知识图谱(Mapping Knowledge Domains)理论和方法。它具有理论综合化、方法多元化、信息可视化以及描绘形象化等诸多特征,因而获得了迅猛发展,一跃成为当代科学计量学的研究热点。综上,知识图谱是管理科学的一个重要理论和方法。本文将采用这一理论和方法开展中国赛事理论演进研究。
(2)知识图谱的定义
知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系,在组织内创造知识共享的环境以促进科学技术研究的合作和深入。具体来说,知识图谱是把应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与科学计量学、文献计量学的共现分析等方法结合,用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构的多学科融合的一种研究方法。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供有价值的参考。
(3)知识图谱的特征
知识图谱是对基于领域内容的结构进行信息可视化,是科技知识管理中数据挖掘和知识发现的有效手段。它通过对知识领域中各个不同单元间关系的展示,揭示某一领域知识的发展。一些针对结构的可视化是从几何结构角度进行的。如针对超链接结构的可视化,但是从认知角度进行的可视化更加重要,它往往可以通过分析文献内容来进行。这样的可视化系统对用户更为有用。这是知识图谱的重要特征。经过多年的发展,特别是ISI(美国科学信息研究所)和南京大学等提供的引文数据库使引文结构的大样本统计分析越来越便利,知识图谱已成为实证研究科学共同体结构与发展的主流方法。
(4)知识图谱的研究对象
知识图谱的研究对象是知识域,是某一知识集合,例如属于某一个范围的一个文献集合就可以称为一个知识域。某一知识领域的科技文献包括论文、专利、调查报告等,一个发展完善的知识领域常常有大量的文献。静态性较强的领域新出现的文献较少,动态的领域中各种各样的文献则不停地出现。知识图谱最常见的研究单元是期刊、文献、作者和关键词(叙词)。它们揭示了同一知识域的不同侧面,使从不同视角分析领域知识成为可能。
(5)知识图谱的应用领域
知识图谱的主要应用领域包括:①从事科学技术活动的学术共同体和作为其知识载体的网络;②某一学科主要研究领域间的内部联系,各研究领域间的知识输入与输出;③研究主题的衍生、渗透与扩散趋势;④学科领域内显性或编码化的知识(作者、机构、专利、期刊和其他出版物等)之间的关系;⑤科学社会网络(科学合作网络)等;⑥科学研究领域的动态化(如增长速度多样化等)。由此可见,知识图谱通过使用多种可视化的思维和发现、探索和分析技术来揭示某一知识域的动态发展,将科学知识的复杂领域、学科前沿和新生长点以 2D或3D的图像或动画直观地表达出来,从而为科学知识的组织、检索,为探索科学发展规律,为科学计量学和科技史研究人员弥补专业知识的欠缺和不足,为科研人员如何选择研课题,为科技管理部门对科技领域进行合理布局与投资,提供了新的方法和手段。
(6)知识图谱的构建过程
知识图谱的构建过程可以概括为:①确定可视对象,即选择合适的分析单元;确定以何种特性关系来展示对象,即选择可视化效果的对象特点;②实现抽象信息特征向空间化图形化特征的映射;③定义或构建可视化空间,即确定如何把所有的可视化对象映射到选定的空间,如何在有限的空间里有效组织知识单元,如何揭示出不可见的知识关联等;④确定可视化图形布局,绘制可视化图形。具体来说,知识图谱绘制需要六个步骤:①选择合适的研究对象;②选定要分析的数据,抽取数据;③确定数据元素之间关系,构造数据元素关系矩阵;④确定合适的相似度算法对原始数据进行标准化处理;⑤用一定的算法把多维数据在二维或三维空间中聚合并图示出来;⑥对图形进行分析和解释。
2.知识图谱的具体绘制方法
根据本文研究内容,将采用以下绘制知识图谱的具体方法。
(1)统计分析
统计分析是本文采用的基本方法,包括对关键词、作者等的频次统计和分析。其中,词频分析方法是本文采取的主要方法之一,依据的基本理论为齐普夫定律:如果把一篇较长文章(约5 000字)中每个词出现的频次统计起来,按照高频词在前,低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为 1,频次次之的等级为 2……频次最小的词等级为D(或L)。若用f表示频次,r表示等级序号,则有f·r=C,式中C为常数。这里的常数并不是绝对不变的恒量,而围绕一个中心数值上下波动。词频分析方法已被许多科学计量学研究者应用于学科前沿的研究。本研究将词频分析方法分别与共引分析、共词分析和社会网络分析等方法相结合,绘制品牌理论的知识结构、研究热点及作者、关键词共现的知识图谱。
(2)引文分析
引文分析(Citation analysis)是指利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用现象进行分析,以便揭示其数量特征和内在规律的一种文献计量分析方法。分析对象不同,引文计量(Citation measure)指标也不同。其中,引文率是各种引用分析中最基本的测度。科学文献的相互引用(引用与被引用)是科学发展规律的表现,由科学本身的发展规律和研究活动规律所决定,也是科学活动中普遍存在的一种必然现象。
Rousseau所著的《信息计量学导论》中介绍了引文标引理论,其基于如下思想:作者对于原先记录的信息的参照表明,前人的很多著作与当前这篇文献的主题是密切相关的。“参考文献”与“引文”是两个不同的概念。如果论文R含有使用并描述论文C的书目注释,那么论文R就含有参照论文C的参考文献,论文C具有来自论文R的引文。或者说,参考文献是一篇文献对另一篇文献的答谢,引文是一篇文献从另一篇文献所得到的答谢。引文分析理论和方法可以用于测定学科的影响和重要性,研究学科情报源分布,确定核心期刊,研究科学交流和情报传递规律,研究文献老化和情报利用规律,研究情报用户的需求特点,进行科学水平等的评价。
(3)共现分析
共现分析(Co-citation analysis)是将各种信息载体中的共现信息量化的分析方法,以揭示信息的内容关联和特征项所隐含的寓意。相同类型特征项的共现包括论文共现、关键词共现、作者共现、期刊共现等;不同类型特征项的共现包括直接关联,如论文与论文作者共现,以及间接关联,如机构与关键词共现、作者与关键词共现等。
1973年,Small基于文献耦合分析科学结构时的缺陷,提出了文献共引分析方法。共引分析,也称共被引分析。当两篇文献共同出现在第3篇文献的参考文献目录中时,这两篇文献就成为被共引的关系。共引频率是这两篇文献一起被引用的频率,频次越多,表明它们之间的关系就越密切,“距离”也就越近。利用现代的多元统计技术如因子分析、聚类分析和多维尺度分析等,则可以按这种“距离”将一个学科内的重要文献加以分类,从而鉴别学科内的科学共同体或无形学院,绘制“科学知识图谱”,使之可视化。与传统的研究者个人归纳、访谈调查等主观分类方法相比,共被引分析最大的优势是它的客观性、分类原则的科学性和数据的有效性。共引分析具动态性、前瞻性、网状非线性等特点。共引分析可用于对学科结构、学科间联系和交流以及学科发展历史作定量的动态分析。建立在共引强度和耦合强度基础上的文献聚类分析逐渐发展成为当前科学计量学最活跃的研究领域之一。
当前,共引概念已经泛化。根据分析对象,除文献共引外,可将共引延伸至作者共引、期刊共引和学科共引分析等。其中以文献和作者共引分析研究最为突出。共引分析作为一种信息分析方法,从引文的角度分析知识单元如文献、作者、期刊等的相互关系,揭示知识单元间的微观主题关系、中观的学科结构和宏观的科学结构,从而将文献信息所反映的知识领域的关系可视化,提供了一个探索科学结构本身即学科内部相互关系和发展脉络的全新思路。本文主要采用文献共引分析方法。它主要体现了同引的参考文献之间的结构关系,从而反映学科之间的某些联系。通过文献的共被引相关群的分析,可以研究科学文献体系的特征结构以及分布、利用等方面的规律。通过文献共引群体网络及其变化,可以研究学科之间的相互关系、联系特征,推测学科或专业的发展变化状况及趋势等。
(4)社会网络分析
社会网络分析(Social network analysis,SNA),也称为“结构分析”,是一个横跨多学科的交叉科学方法,其主要理论依据来源于数学和计算机技术。在社会网络分析中,行动者之间的关系成为研究的第一要素,个体的属性是第二位的。此分析方法在科学计量学领域也得到了应用,如分析科学研究中的合作关系网络、期刊的引用及被引关系网络等。可以进行个体网分析和整体网分析,通过整体网分析可以揭示该网络的结构特性,如网络的构成、规模、密度、中心性、凝聚子群、核心边缘结构等一系列量化特征。社会网络分析方法最常用的是K核分析。K核分析是社会网络研究中凝聚子群的一种,凝聚子群是满足如下条件的一个行动者子集合,即在此集合中的行动者之间具有相对较强、直接、紧密、经常的或积极的关系。K核是建立在点的度数基础上的凝聚子群概念,是通过对网络子群中的每一个成员的邻点个数进行限制而得到的。K核指的是满足一个条件的子图,即子图中的点都至少与该子图中的K个其他点邻接。通过改变K的值,就会得出不同的子图。随着K的增加,K核的子图成员会逐渐减少,而成员之间的关系会更紧密。本文将运用SNA方法构建作者合作共现图谱。在社会网络分析中,把由一类行动者集合(模态)与另一类行动者集合(模态)之间的关系构成的网络称为2-模网络。如果一个模态为行动者集合,另一个模态为这些行动者所参与事件的集合,则称这样的2-模网络为隶属网络。通过对隶属网络的研究,可以表明行动者和事件相互之间的关系;通过行动者而形成的事件之间的关系;通过事件而产生的行动者之间的关系。本文选择“作者”和“主题词”两项文献特征来构建2-模网络模型。
本文分析数据来自CSSCI数据库中的文献,选择高级检索进行源数据检索,检索策略是:TS=(篇名=体育赛事或赛事)或者(关键词=体育赛事或赛事),检索时间范围是2000—2022年,筛选共得到789条符合条件的检索记录(检索时间2022年12月19日)(见表1-4)。本文采用陈超美教授开发的信息可视化软件CiteSpace。
表1-4体育赛事数据来源