购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.3 本书概述

数字人文与知识图谱是当今世界两个正在蓬勃发展的研究领域。本书站在这两个领域的交叉地带,探索数字人文领域的知识图谱构建方法,为数字人文领域知识的重构和研究范式的改变奠定基础。传统的人文研究往往建立在实体资源的基础上,或者通过进行数字化并为数字化资源添加元数据的方式来完成资源的描述与组织,但也仅仅是揭示资源的浅层的、粗粒度的特征,难以实现对资源的深度分析与有效利用 [38] 。信息技术和人工智能技术的发展和应用,为将数字人文资源转化为计算机可读、可处理的高质量数字资源提供了可能。知识图谱通过重构数字人文资源,改变信息的获取、标注、比较、取样、阐释与表现方式,帮助研究人员更加便捷地发现和验证人文世界的更多规律、脉络和趋势,在与历史、地理等知识的关联中获得更加宏观的学术视野。

尽管知识图谱在诸多领域有了成熟的应用,但是,数字人文领域的问题和需求有其特殊性,需要在知识图谱构建的过程中对具体问题进行具体分析。本研究的主要目标是结合数字人文领域的研究场景和数据特点,分析数字人文领域知识图谱构建在不同阶段所面临的特殊问题,提出数字人文领域知识图谱的构建方法,并进行实践验证。

本书的第2章介绍了数字资源组织与表示的基础知识。该部分从知识图谱的前身——语义网说起,随后介绍了关联数据、本体这些对知识图谱的产生和发展起到推动作用的方法和技术,揭示进一步发展出知识图谱技术的必要性。接着,介绍了知识图谱的概念和起源、数据存储以及不同类别的知识图谱。第3章介绍了数字人文领域知识图谱构建的方法。这一章首先分析了数字人文资源的特点和发展趋势,介绍了知识图谱构建基础,给出了数字人文领域知识图谱构建方法的整体框架。接下来的小节依次对该框架中的各个环节进行了具体的介绍,包括领域本体构建、知识抽取、知识融合、知识推理,此外还强调了在数字人文领域知识图谱构建中需要重视的基于众包的人机协作模式和全过程质量控制问题。知识图谱构建是一项系统工程,将相关内容置于同一个章节,使其更加紧凑。第4章介绍了数字人文领域中的一项具体实践——家谱知识图谱构建。家谱是中华民族文化遗产中的一种宝贵资源,对数字化家谱进一步深度开发和利用,不仅有利于这些文化遗产的保存、整理和修复,还将促进家谱资源的传播和传承。这一部分介绍了依托浙江高迁吴氏西宅宗谱数字资源开展的家谱知识图谱构建的实践,包括家谱本体构建、基于深度学习的家谱信息抽取及其针对小规模标注数据的优化、知识融合方面的具体工作。第5章介绍了在上述工作的基础上开展的家谱可视化应用。在分析中华传统家谱的特点和中西方家谱可视化形式之后,提出了中华传统家谱的两种可视化形式,设计实现了可视化平台的原型,并以浙江高迁吴氏西宅宗谱为例进行可视化展示。该平台提供了一种开放家谱数据的模式,使研究人员可以从中获得更多的研究资源,也可以在一定程度上满足个人在线修谱的需要。同时,平台也为在线协作修谱提供了可能。

[1]徐宗本.“数字化、网络化、智能化”新一代信息技术的聚焦点[J].科学中国人,2019,415(7):36-37.

[2]COUGHLIN T.175 zettabytes by 2025[EB/OL].(2018-11-27)[2021-01-25]. https://www.forbes.com/sites/tomcoughlin/2018/11/27/175-zettabytes-by-2025/?sh=4ebd4b195459.

[3]IDC.2025年中国将拥有全球最大的数据圈[R/OL].(2019-02-25)[2021-09-01].http://www.chinastor.com/market/0226403122019.html.

[4]陈国青,吴刚,顾远东,等.管理决策情境下大数据驱动的研究和应用挑战:范式转变与研究方向[J].管理科学学报,2018,21(7):1-10.

[5]孟小峰.大数据融合研究:问题与挑战[J].计算机研究与发展,2016,53(2):231-246.

[6]肖仰华.知识图谱:概念与技术[M].北京:电子工业出版社,2020.

[7]安妮·伯迪克,约翰娜·德鲁克,彼得·伦思费尔德,等.数字人文:改变知识创新与分享的游戏规则[M].马林青,韩若画,译.北京:中国人民大学出版社,2018.

[8]NYHAN J,FLINN A.Computation and the humanities:towards oral history of digital humanities[M].Cham:Springer International Publishing,2016:2-4.

[9]SVENSSON P.Humanities computing as digital humanities[J].Digital humanities quarterly,2009,3(3).

[10]林施望.从“人文计算”到“数字人文”:概念与研究方式的变迁[J].图书馆论坛,2019,39(8):12-20.

[11]FLANDERS J,TERRAS M,PIEZ W.Welcome to digital humanities quarterly[J].Digital humanities quarterly,2007,1(1).

[12]邓君,孙绍丹,王阮,等.美国29所高校数字人文项目研究内容解析[J].情报资料工作,2020,41(3):31-40.

[13]Deep imaging Egyptian Mummy Cases[EB/OL].[2020-09-17].https:// www.ucl.ac.uk/digital-humanities/projects/Deepimaging.

[14]LEVY F,MURNANE R.Dancing with robots:human skills for computerized work[EB/OL].(2013-06-01)[2021-01-28].https://dusp.mit.edu/uis/publication/ dancing-robots-human-skills-computerized-work.

[15]Betwee the tides[EB/OL].[2020-09-17].http://web.stanford.edu/group/ spatialhistory/cgi-bin/site/project.php?id=1005.

[16]Hyperstudio digital humanties at MIT[EB/OL].[2020-09-17].http://hyperstudio.mit.edu/projects/german-radio-art/.

[17]African origins[EB/OL].[2021-01-29].https://legacy.african-origins.org/.

[18]中国历代人物传记资料库(CBDB)[EB/OL].[2020-09-17].https://projects.iq.harvard.edu/chinesecbdb.

[19]中国历史地理信息系统(CHGIS)[EB/OL].[2021-12-18].http://yugong. fudan.edu.cn.

[20]汉籍电子文献[EB/OL].[2020-01-28].http://hanji.sinica.edu.tw/.

[21]盛洁临.“数字敦煌”项目对我国文化遗产保护的启示[N].中国文物报,2020-06-23(4).

[22]余力,管家娃.中国古籍数字化建设现状分析及发展研究[J].数字图书馆论坛,2017(11):41-47.

[23]王婷.文物真三维数字建模技术在秦始皇兵马俑博物馆中的应用:以一号坑陶俑为例[J].文物保护与考古科学,2012,24(4):103-108.

[24]夏翠娟,张磊.关联数据在家谱数字人文服务中的应用[J].图书馆杂志,2016,35(10):26-34.

[25]UCHACZ T H.Early Modern Letters Online(EMLO)[J].Isis,2019,110(3):567-569.https://doi.org/10.1086/704722.

[26]任明,许光,王文祥.家谱文本中实体关系提取方法研究[J].中文信息学报,2020,34(6):45-54.

[27]TONRA J,DAVIS B,KELLY D,et al.Poetry in motion:quantified self data and automated poetry generation[EB/OL].[2021-01-29].https://dev.clariah.nl/files/ dh2019/boa/0348.html.

[28]赵星,李书宁,肖亚男.数字人文视域下基于多源数据融合的人物专题数据库建设:以上海图书馆2018开放数据应用开发竞赛作品“树人者”为例[J].图书馆杂志,2019,38(12):45-51.

[29]张力元,王军.基于社会网络动力学的两宋学术和政治体系比较分析[J].情报工程,2020,6(1):34-49.

[30]SCHICH M,SONG C,AHN Y Y,et al.A network framework of cultural history[J].Science,2014,345(6196):558-562.

[31]姜育彦,李雅茹.基于数字人文视角的“情感—时空”模型探析[J].农业图书情报学报,2020,32(6):23-33.

[32]陈刚.“数字人文”与历史地理信息化研究[J].南京社会科学,2014(3):136-142.

[33]高胜寒,赵宇翔,朱庆华.国内外数字人文领域研究进展分析[J].图书馆杂志,2016,35(10):9-18.

[34]MARTIN-RODILLA P,GONZALEZ-PEREZ C.Metainformation scenarios in digital humanities:characterization and conceptual modelling strategies[J].Information systems,2019(84):29-48.

[35]ESCHENFELDER K R,CASWELL M.Digital cultural collections in an age of reuse and remixes[J].Proceedings of the American society for information science and technology,2010,47(1).

[36]欧阳剑,彭松林,李臻.数字人文背景下图书馆人文数据组织与重构[J].图书情报工作,2019,63(11):15-24.

[37]陈涛,刘炜,单蓉蓉,等.知识图谱在数字人文中的应用研究[J].中国图书馆学报,2019,45(6):34-49.

[38]左丹,欧石燕.人文信息资源语义描述、语义组织研究与实践述评[J].图书馆论坛,2019,39(8):21-31. ngyx0KPxGd6E/4/NHhx5SuT4QkGMS2n2El0NfzeR2F2rgQJCrstYB7P4Tfd8Siwu

点击中间区域
呼出菜单
上一章
目录
下一章
×