科学计量学方法能够对引文的结构进行分析,以揭示更多的信息和规律,其中较成熟的方法的是共被引分析(Co-citation Analysis) [9] 。当两篇文献(作者)同时被三篇文献引用,称这两篇作品(作者)存在共被引关系;经常一起被引用的文献(作者),则表示他们在研究主题的概念、理论或方法存在相关性。为此,共被引分析认为文献(作者)共被引的次数越多,他们之间的关系就越密切,“距离”也就越近。利用多元统计技术如因子分析、聚类分析和多维尺度分析等方法,可以按这种“距离”将一个学科内的重要文献(作者)加以分类。鉴别学科内的科学共同体或隐性学术群体,据此绘制“科学地图” [10] ,使之可视化,从而学科的内部结构实现可视化,进而帮助研究人员及时了解自己的研究在世界知识版图中的位置,为进一步开展深入研究提供更加明确的方向。
可以认为,普赖斯是科学知识图谱最早的开拓者,他通过定量统计的方法来发现科学知识的指数增长规律,可以看作是规模较小的科学知识图谱。可视化技术将信息处理技术、知识计量技术、数据挖掘技术、人工智能、计算语言学和认知语言学等众多技术结合起来,进行统一的研发,以便更好地揭示文本信息中隐含的概念及其关系。以加菲尔德为主的科学团体创建了一系列关于知识域(包括动态系统、信息可视化、共引、引文耦合和科学计量学等)的资料数据库,由此形成某一学科发展的历时的图谱。搜索引擎公司Google提出了将孤立信息、数据的格式进行加工、改良,以获取有用的信息,还提出通过各种超级链接分析,进而打造环球网图表模型和历时的聚焦式缓慢动态模型,最终发现了科学研究共同体。
此外,引文分析中的可视化系统模块通常由数据管理、系统管理、聚类成图和查询统计等模块组成。其中,聚类成图模块是将分析结果实现可视化的一个重要环节,其大致可包括作者聚类、期刊聚类和文章聚类三部分。对作者的聚类可以反映出学科领域内不同学科的带头人、不同作者之间的疏密程度等科学成果;期刊的聚类图则可反映期刊的地位;文章聚类可反映文章所涉及的课题在学术发展中的重要程度。不同的引文网络揭示的内容和意义,根据研究人员的不同理解和分析有所不同,可以具体从网络图进行具体分析。