购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.1 基于学术论文的分析

目前,工程科技大数据作为一种新兴的大数据形态,已经成为学术界研究和关注的重点。在实践中,工程科技大数据与知识服务融合形成的智能知识服务体系已成为图书情报领域重要的研究方向和服务生态系统的核心环节,这意味着基于工程科技大数据智能的知识服务既是新时期学科咨询服务的新模式之一,同时也成为大数据时代知识服务体系中的重要方式和手段。工程科技大数据智能知识服务的发展一方面能够为现有知识服务提供丰富的数据资源,另一方面也在数据导向的资源、技术、思维和协作等方面引发了众多新的机遇与挑战。因此,系统梳理工程科技大数据与知识服务融合的相关研究脉络,展望其发展趋势,对于深化智能知识服务研究与实践具有极其重要的意义。

基于此目标,本章以Web of Science核心合集数据库中的学术论文为数据来源,以工程科技大数据智能知识服务为主题制定检索策略(检索策略详情见附录A),文献类型限制为“Article”“Proceeding Paper”“Review Article”“Early Access”,时间限定为2021年12月31日之前,检索得到学术论文30431篇,其中每篇论文中包含作者、国别、题目、发表年份、出版物、关键词、摘要等数据。基于这些学术论文的相关信息,应用文献计量的相关理论和工具对基于工程科技大数据智能的知识服务研究进展与热点趋势进行梳理和分析,从中得到以下结论。

2.1.1 总体研究历程呈现稳步上升的发展态势

随着知识经济的到来,以智力资源和知识为主导的生产与配置模式逐步替代了传统工业社会的以物质产品生产为主导的生产状态。在这一过程中,知识作为最为重要的资源形式,发挥了极其重要的作用,这意味着现代经济的发展水平与发展速度直接决定于社会对知识创造和运用的能力,经济与社会的需求直接催生“知识服务”理论与实践的产生。随着信息技术的飞速发展和知识经济的到来,知识服务的研究已受到学术界的广泛重视,尤其是大数据与知识服务融合研究更是知识服务相关领域的热点,近年来发展迅猛,涌现出了很多成果,进而推动了知识服务理念与技术发展及革新。

科学文献的发文量和研究主题时序变迁能够反映研究领域受关注程度与发展演变,而就工程科技领域而言,探索其中大数据智能的知识服务的发展状况与脉络,对于掌握工程科技全行业的发展状况具有极其重要的意义。为此,基于上述收集的目标文献进行研究主题与发文量时间线分析,统计全球工程科技领域基于大数据智能的知识服务研究的变化趋势,所得结果如图2-1和图2-2所示。

由图2-2和相关数据的分析结果可知,工程科技大数据智能知识服务领域最早的研究始于1995年,该年内共有141篇有关该领域的研究论文发表。在此之后年度发文量整体上呈现出稳步上升的态势,研究主题所涉及的范围也逐年扩展,这说明工程科技领域的智能知识服务受到学术界众多学者的广泛关注,研究范围与学术影响力不断扩大,大数据智能作为知识服务所依托的基本要素之一,也得到了全球大多数学者的认可。综观全球基于工程科技大数据的知识服务整体研究历程,主要可以分为以下3个阶段。

img

图2-1 全球工程大数据智能知识服务研究主题时间线演变图

img

图2-2 全球工程科技大数据智能知识服务研究发文量年度变化趋势

(1)初始阶段(20世纪90年代至2004年)。在此阶段,由于在工程科技领域,大数据理念和技术还处于初创阶段,大数据的方法体系还没有被完全建立起来,工程科技大数据与知识服务融合的研究处于起步状态,年度整体发文量在500篇以下,处于一个较低的水平。同时,其研究主题所涉范围较窄,在研究主题时间线演变图(图2-1)中的此阶段(2004年之前)几乎没有节点团,说明此时间区间内研究领域规模不大。在研究内容方面,此阶段研究侧重点在于根据工程科技学科领域的不同需求辨析基于海量数据的知识服务的概念和应用范围,并尝试和倡导以数据为基础的知识服务活动的开展。相关研究主题多偏重工程科技领域内知识服务概念辨析与初步实践方式的探索,所得到成果主要集中在3个方面:一是在不同应用领域内开展面向数据的知识服务活动的相关做法和经验;二是基于海量数据的知识服务概念与理论的辨析;三是探索数据驱动型知识服务与传统知识服务的关联与区别。这一阶段以“1997年美国专业图书馆协会(SLA)在其会刊上推出知识服务概念”和“2004年作为大数据应用重要环境的 Web2.0 和Facebook等社交媒体的出现”为标志性事件。

(2)成长阶段(2005年至2012年)。在这一阶段,随着大数据理念及其分析方法体系的确立,工程科技大数据智能知识服务研究迈入了一个快速成长的阶段,学术论文的发文量明显增加,尽管其中个别年份发文量有下降,但总体保持较快的增长态势,其年度发文量在450~1300篇。其研究主题数量明显扩展,研究内容与层次的集中度也显著增强,在研究主题时间线演变图(图2-1)中表现为出现数个较大的紧密节点团。具体而言,相较于初始阶段,此阶段的研究成果不仅仅局限于概念的辨析与经验的总结,更多的是从战略层面和技术层面研究和探讨大数据与知识服务的融合,全面展示和构建数据驱动型知识服务的概念体系、学科应用、服务模式、技术体系等方面的研究,呈现出4类研究特点:一是对基于工程科技大数据的知识服务理论体系的探索更加深入;二是大数据与知识服务融合模式的研究已扩展到工程科技的更多学科领域中;三是工程科技领域内数据驱动型知识服务的应用范围显著扩大;四是面向工程科技大数据的知识服务技术创新更为多元化。此阶段以“2005年对工程科技领域大数据存储应用具有重要意义的Hadoop开源框架提出”和“2012年美国政府投资2亿美元启动‘大数据研究和发展计划’”为标志性事件。

(3)快速发展阶段(2013年至今)。该阶段以“2013年知识图谱大规模应用”为标志性事件,在这一过程中,由于大数据各项技术的成熟和广泛应用,学术界对大数据与知识服务融合的研究也进入了快速发展阶段,年度发文量急剧提升,年均发文量超过2200篇。相较于前一阶段,本阶段研究主题的扩张效应更加明显,在研究主题时间线演变图(图2-1)中表现为出现大量规模较小且分散的节点,说明此阶段研究主题在原有基础上不断衍生和扩展,研究内容范围大幅增加,而其研究模式与成果则呈现出相对成熟和稳定的发展态势。具体而言,这一阶段的研究进展和成果主要体现在3个方面:一是在理论层面,本阶段针对概念与理论体系的研究已较为成熟和完备,已形成一系列有代表性和有深度的理论体系,如大数据环境下知识服务网络理论、知识服务网络演化理论、知识服务过程与优化理论、知识服务能力构建理论等,极大地丰富了既有知识服务理论生态,有力地推动了传统信息服务向智能知识服务的转变。二是在主题层面,本阶段的研究主题与热点体系已基本成熟,主要包括:①基于大数据的知识服务关键要素,如资源、政策、人员、设施等;②数据驱动型知识服务模式研究,如“互联网+”、智慧服务、大数据分析等;③平台建设技术研究,如企业应用平台、学科服务平台、科研协作平台等构建技术;④新型信息技术引领方式研究,即云计算、人工智能、“互联网+”等技术应用于新型知识服务的方式研究。三是在研究方法上,在本阶段更多的定量分析、模型应用等方法开始出现在研究过程中,实证研究、博弈研究、扎根理论、案例分析、系统动力学模型、结构方程模型等规范化研究方法及多方法复合的研究模式已广泛应用于智能知识服务研究领域,使智能知识服务研究体系更为完备,研究成果更准确。

2.1.2 发文机构与国家分布“头部”效应日益明显

基于所获取的研究论文数据,以第一作者的国家和机构作为论文的归属依据,分析全球基于工程科技大数据智能知识服务领域的发文分布状况,得到的统计结果如图2-3和表2-1所示。

就学术论文发文国家分布而言,中国(6844篇)、美国(6398篇)和英国(2104篇)居前3位,此外,德国等欧盟国家,以及日本、韩国及印度等发达国家和新兴经济体国家发文量也较多,这些国家也是全球大数据、人工智能和知识服务理论与技术研究与应用最为活跃的区域。就总发文量而言,中国、美国、英国这3 个排名前3位的国家的发文量占排名前20位的国家总发文量的比例高达51.3%,呈现出很强的“头部”效应,充分说明了近年来世界范围内工程科技大数据智能知识服务领域的研究呈现出向特定国家和地区集聚的态势,相关学术研究合作网络的地域化集中趋势日益明显。而在论文发文机构分布方面,这种“头部”集聚效应更加明显,表 2-1的统计数据表明,在全球发文量排名前20位的机构中,中国机构的总发文量占比为31.4%,美国机构的总发文量占比更是高达40.1%,工程科技大数据智能知识服务领域的学术论文的发文机构集中度呈现出持续增强的态势。

img

图2-3 工程科技大数据智能知识服务领域发文量排名前20位的国家

表2-1 工程科技大数据智能知识服务领域发文量排名前20位的机构

img

(续表)

img

2.1.3 研究主题的融合趋势持续增强

基于所收集的工程科技大数据智能知识服务领域的研究论文数据进行发文期刊/论文集来源分析,所得到的分析结果如表2-2所示。

表2-2 工程科技大数据智能知识服务领域发文量排名前20位的期刊/论文集

img

(续表)

img

就期刊/论文集所涉及的领域而言,表2-2中所列期刊/论文集共涵盖了148个学科,在Web of Science学科分类体系中的占比高达58.3%,学术论文来源期刊/论文集的跨学科融合的态势极为显著。具体来说,以发文量排名前3位的期刊/论文集 IEEE Access Expert Systems with Applications ASEE Annual Conference & Exposition 为例, IEEE Access 作为期刊引用报告分区中的计算机科学大类下的电信学专业学术期刊,是由IEEE出版的著名的开源期刊,其论文内容主题范围涵盖IEEE所有领域,多学科交叉性、融合性是该期刊/论文集的一个最为重要的特征; Expert Systems with Applications 作为计算机科学和人工智能领域的重要期刊,其论文主题更是涉及计算机与智能化技术研究与应用的各个学科和场景;而 ASEE Annual Conference & Exposition 作为知名的学会年度会议论文集,其中刊登了大量工程科技领域各学科研究进展的论文,论文主题范围涉及工程科技领域的各个方面,跨学科、多领域的论文在该论文集中占据主导地位。由此可见,在工程科技大数据智能知识服务领域发文量排名前20位的期刊/论文集中,由于开放科学理念发展和工程领域技术演进的需要,各期刊/论文集论文主题跨领域和多学科融合的特性已成型,从而进一步阐释了工程科技领域各项研究主题多学科与多领域的融合格局已成为当前和未来学术研究发展的重要趋势。

2.1.4 应用场景与技术的扩展正成为当前研究热点分布的一个重要特征

应用VOSviewer软件对Web of Science核心合集数据库收录的工程科技大数据智能知识服务领域相关文献进行关键词聚类分析,重点从研究主题的角度把握研究热点的整体发展脉络和方向,聚类分析结果如图2-4所示。

img

图2-4 工程科技大数据智能知识服务领域相关文献的关键词聚类分析结果

由图2-4可知,工程科技大数据智能知识服务领域学术论文的研究主题的聚类大致可划分为5类,基本代表该领域5个主要的研究主题,其具体内容如下。

1.工程科技领域的知识管理相关影响因素

该聚类主题(见图2-4中左下方节点团块)所涉及的研究包括个案分析、实施的阻碍与风险、关键成功因素、前景分析、新产业的发展、工程教育的可持续性等。包含关键词:knowledge management、design、sustainability、case study、new product development、engineering design、innovation、knowledge sharing、integration、industry等。例如,Elia等 [1] 于2020年提出在更广阔的工业工程领域内,管理工程已成为整合技术和知识管理的新视角,讨论了在当前社会技术情景中整合管理和工程知识的框架。具体而言,知识管理相关影响因素的聚类研究主题分为两个方向:一是建筑行业的知识服务,建筑行业在建筑物的整个生命周期中都会产生大量数据,知识服务可以在建筑实施的多个过程中发挥作用,主要以建筑信息模型和场外施工相结合的形式进行应用 [2] 。相关服务内容主要包括确定施工延误的原因 [3] 、项目审查文件分析 [4] 、建筑诉讼决策支持系统 [5] 、建筑物结构损伤预测 [6] 、工人和重型机械对施工安全的影响分析 [7] 、建筑项目的成本和质量控制 [8] 等。将先进的智能计算技术与主流建筑系统相结合,能够在舒适度最大化和能源最小化之间取得平衡,通过预测分析优化建筑的整体性能。二是制造行业中有关产品生命周期管理的知识服务,通过网络物理系统实现物理和虚拟世界的融合,实现产品生命周期开始、生命周期中及生命周期结束的管理,目标是提高产品设计、生产和服务过程中的智能化和效率 [9]

2.专家系统在各类学科决策场景下的应用范畴

该聚类主题(见图2-4中上中部节点团块)所涉及的研究内容包括水质控制、废物管理、气候变化、状态监测、癌症诊断、疾病预测等热点问题。包含关键词:decision-making、data-driven、diagnosis、prediction、classification、uncertainty、reliability、damage detection、identification、risk management等。例如,Sandoval等 [10] 构建了景观植物病虫害的专家诊断系统,以此帮助非专家用户早期诊断并及时治疗。具体而言,“专家系统在各类学科决策场景下的应用范畴”的聚类研究主题分为两个研究方向:一是可持续农业,机器学习在农业供应链中的应用是当前的热点问题 [11] 。物联网、区块链和大数据技术是可持续农业供应链的潜在推动力,这些技术正在推动农业供应链走向数据驱动的数字供应链环境 [12] 。颠覆性信息和通信技术与农业科学的结合是达到生产力和产量提高、水资源保护、确保土壤质量及加强环境管理的关键,从而确保未来粮食安全、食品安全和生态可持续性 [13] 。二是医学领域的疾病辅助诊断,如基于心电图信号、实验室检查结果和体格检查诊断,通过混合机器学习算法建立心脏病预测模型 [14] 。除重点慢性病诊断的决策支持外,COVID-19在数据检索时间范围内于2020年、2021年是热点研究问题,如预测新感染病例数 [15] 、早期诊断COVID-19患者 [16] 、COVID-19疫苗的自动推理计算 [17]

3.机器学习相关模型深度应用于各类资源配置

该聚类主题(见图2-4中右侧中下部节点团块)所涉及的研究内容包括提高能源分配与能源利用效率、公共交通治理、智慧城市建设与城市规划问题。包含关键词:machine learning、data models、power allocation、internet of things、task analysis、optimization、resource management、public transportation、quality of service、energy efficiency等。例如,Chen等 [3] 介绍了智慧城市中基于深度学习技术的网络安全应用和用例,并指出信息泄露和恶意网络攻击等网络安全隐患是值得关注的领域。具体而言,“机器学习相关模型深度应用于各类资源配置”的聚类研究主题分为两个研究方向:一是车联网环境下的多维资源管理,如将边缘计算范式用于为车联网中的大规模实时服务,以提供低延迟通信资源和基于5G车联网的联合计算有效分配网络资源 [18] 。二是城市废物和能源管理 [6] 。以适当的建筑废物回收机制作为补救措施,可以使有限的资源免于恶化,这可以通过系统地将建设项目分配给建筑废物回收设施来保证。基于集成模拟优化方法的新型简单启发式方法能够精确地将产生的建筑废物分配到回收设施。在能源调度方面,基于区块链的预测能源交易平台能够为分布式能源资源提供实时支持、日前控制和发电调度。

4.知识组织理论在网络服务中的作用

该聚类主题(见图2-4中下部节点团块)所涉及的研究内容包括推荐系统、信息检索、产品大批量定制、社交媒体、电子健康记录等。包含关键词:big data、ontology、semantic web、data mining、association rule、nature language processing、knowledge presentation、platform、interoperability、disaster management等。例如,Mohanty 等 [4] 挖掘自然灾害期间社交媒体中的数据,为政策制定者、环境管理人员、应急管理人员和领域科学家推荐具有特定属性的推文,以便用于灾难不同阶段(如准备、响应和恢复)的研究。在推荐系统建设方面,推荐的准确性和隐私保护性能间的平衡是当前的研究热点 [19]

5.数据科学理论、计算机科学技术与工业4.0的深度融合的展望

该聚类主题(见图2-4中下方部分节点团块)所涉及的研究内容包含数字孪生技术、虚拟现实、区块链技术在未来智慧工厂、智能制造等复杂信息物理系统中的应用。包含关键词:augmented reality、blockchain technology、digital twin、fourth industrial revolution、challenges、virtual reality、smart factory、smart manufacturing、maturity model、intelligent manufacturing等。例如,Choi等 [5] 提出了一个基于云计算的数字孪生平台。该平台使用模拟和人工智能等分析技术进行预测,并通过使用虚拟现实或增强现实技术产生的直接经验来进行快速决策,从而实现控制物理工厂的目标。在工业4.0时代,制造过程中要求生产力和响应能力能在各种环境中实现自动化。对机器进行密切监控能够主动解决可能使生产系统停止或减慢的问题,从知识管理的角度来看,这一过程往往会产生大量的数据,因此知识服务的目标是使用智能信息物理系统来处理各种复杂情况,并自动处理故障预测和规划维修工作 [20]

综观上述5类研究主题,这些研究主题的一个共同特征在于对应用场景与技术大幅扩展,这也代表了工程科技大数据智能知识服务研究领域热点发展的一个重要趋势,同时也从另一个角度证明了以学科融合为主要特征开放科学理念日益成为智能知识服务未来发展的重要基石。而就国内外基于工程科技大数据智能知识服务的研究热点差异而言,相对于国内学术界对技术与应用方式的关注,国外学术界更为关注服务表达、应用技术和创新度等要素,表现为关键词中宏观性、理论性词组的出现频次与聚类集中度较高。同时,就整体而言,近年来全球学术论文关键词中心度较小,这表明当前世界范围内基于工程科技大数据智能知识服务的研究主题广度大大增加,而相关热点变化趋势则呈现出较平稳态势。

2.1.5 服务导向的技术形式是当前技术研究的一个重要聚焦点

面向技术的研究和探索是工程科技大数据智能知识服务领域学术论文的一个重要方向。由于现有计量分析不能直接从学术论文中提取技术内容,故本书借助2.1.4节论文主题分析的聚类结果,提取出与具体技术形式相关的关键词,出现次数排名前10位的关键词如表2-3所示。

表2-3 技术导向排名前10位的关键词

img

具体分析表2-3中的各项技术关键词可以发现,本体(ontology)、虚拟现实(virtual reality)、区块链技术(blockchain technology)、增强现实(augmented reality)、数字孪生(digital twin)等严格意义上的服务导向的技术形式占比高达50%。其中,本体(ontology)在目标学术论文中出现的次数高居第3位,仅次于机器学习(machine learning)和物联网(internet of things)这类较为通用的技术形式,这充分表明知识服务关联的技术形式,是当前工程科技大数据智能知识服务领域学术论文技术研究的一个重要聚焦点。

就知识服务本身而言,其作为大数据智能应用与服务的高级阶段 [21] ,是在知识经济背景下提供智力支持服务和实现知识创新的有力工具。知识服务及其关键技术的发展与应用不但能够推动各类知识信息的收集、存储和传播,而且还可以有效地把握各类知识之间的相互关系、创造挖掘新的知识 [22] 。就工程科技大数据领域的知识服务而言,其关键技术继承了广义领域知识服务的各类技术范畴和分类维度,但由于其大数据智能和服务导向的属性使其还具有相对特殊性,所引发的相关技术形式除媒体检索、智能问答、智能决策支持等通用技术外,还包括长期预测 [23] 、形势分析 [24] 、生产指导 [25] 、监测预警 [26] 、个性化推荐 [27] 等较为特殊的技术表现方式,以最大限度地满足工程科技领域内基于大数据智能的知识服务的实际需要,推动整体服务水平持续提升。

系统梳理知识服务导向的相关技术的学术文献的研究脉络可知,这些知识服务的关键技术形式很早就已成为学术界关注的一个重点。具体而言,在工程科技领域的知识服务技术平台最早出现于21世纪初,以E-Learning(Electronic Learning)模式为标志,随后经历了M-Learning(Mobile Learning)阶段,发展到当前线上线下融合的智能知识服务阶段 [28] 。就知识服务技术范畴而言,其技术体系可分为前台技术、中台技术和后台技术 [21] ,其中:前台技术功能是适应用户需求,实现与用户的交互,主要包括场景化应用构建技术、专题构建技术、知识可视化技术及平台构建技术等;中台技术重在解决数据的关联计算,包括智能搜索技术、用户画像技术、知识挖掘技术、知识地图技术等;后台技术重在实现对数据资源的管理和对业务流程的支撑,包括知识标引技术、知识本体技术、知识抽取技术、知识关联技术等。知识服务技术体系与发展脉络如图2-5所示。

预期当前和今后很长时期内,知识服务导向的关键技术将会向着与新兴信息技术融合化的方向发展,这意味着以大数据智能为核心的知识服务关键技术将会密切融合当前日益成熟的云计算、人工智能、区块链、元宇宙、数字孪生等技术,在数字加密、电子契约、知识推介、知识融合、个性化服务等领域实现新的突破,构建集全域感知、万物互联、泛在计算、数据驱动、算法辅助决策等功能于一体的管理与服务支撑平台,使用户能够充分沉浸到知识服务的各类场景中,将各类知识服务内容充分呈现,力图以数字化的方式展现知识服务各过程的物理状态,从而颠覆传统知识服务场景与服务管理模式,进而为智能化知识服务的转型和升级提供技术支持和保障。

img

图2-5 知识服务技术体系与发展脉络
2QTYmPU6iWQ43VC73wAYZVgnfZRrNUEyQh7YjDs3QPEeGnHTeRmla4FQVI7DaN0x

点击中间区域
呼出菜单
上一章
目录
下一章
×