信息在时间轴上的动态分布可以揭示信息的增长与老化,用高效的理论模型来刻画信息随时间的推移所表现出来的趋势,把握信息量的变化,对信息实施动态管理。1972年,罗马俱乐部第一份报告《增长的极限》面世,该报告通过对人口、教育、健康、环境、生态进行预言,提醒人们警惕当时的经济发展与增长模式存在的问题
。2018年10月25日,全球顶级智库罗马俱乐部继《增长的极限》之后,推出又一力作
Come On
,中文版译名为《翻转极限》,50年前的预言得到应验。我们生活在一个信息爆炸式增长的时代
,信息的增长是指随着时间推移,信息数量增加的情况。美国《化学文摘》在实现第一个100万篇文献时花了32年,而实现第二个100万篇则花了18年,第三个100万篇花了8年,第四个100万篇文献仅花了3.3年。科学技术的发展,带来了信息量的剧增,随之而来的是科学知识量的增长,这使得人们不得不关注信息增长。
(1)普莱斯提出的指数增长模型
早在20世纪初期,人们就已经注意到了科学文献具有增长规律这一社会现象。但直到20世纪40年代,这一现象才被研究者重视,最具代表性的研究成果就是普莱斯提出的指数增长模型。普莱斯(D.Price)考察统计了科学期刊的数量增长情况,发现科学期刊的数量大约每50年增长10倍。他进一步用坐标轴形象地展示了文献增长规律,以文献量为纵轴,以时间为横轴,以各个不同年代的科学文献为点,然后以光滑曲线连接各点,近似地表征了科学文献随时间增长的规律。
通过对曲线的分析,普莱斯发现科学文献增长与时间呈指数函数关系。如果用 t 表示时间, F ( t )表示时刻 t 的文献量,则普莱斯提出的指数增长模型公式为
式中, α 是统计的初始时刻的文献量; k 是文献量的持续增长率;e是自然对数的底数。
普莱斯提出的指数增长模型是刻画文献增长规律的理想模型,近似反映了文献数量的实际增长情况。但由于没有考虑许多复杂因素对科学文献增长的限制,所以实际应用中该模型亦具有一定的局限性:第一,科学文献并不总是按照指数函数关系增长,普莱斯提出的指数增长模型与所研究的文献的学科和时间都有关系,并不是所有的学科在任何时期内的文献都是按照指数增长的。第二,在确立科学文献的指数增长规律时,没有考虑文献增长中日益老化的因素。第三,在统计某年科学期刊累计总数时没有考虑停刊的科学期刊这一因素。第四,根据上述规律,我们可以发现,当 k 趋于正无穷时,科技文献的增量会趋于正无穷,而这并不现实。因此,该模型无法预测文献的未来趋势。
(2)逻辑曲线
只有在没有任何因素限制增长时,增长才会表现为指数增长曲线
。而如果出现经济、制度、人力等方面的制约因素时,指数增长曲线都将转向其他增长曲线,如逻辑增长曲线。逻辑曲线是指自然界与人类社会中广泛存在的增长模式,在生物学中便是有名的生长曲线。另外在有限条件下的人口增长、经济发展等过程也属于此类。与纯粹的指数增长曲线相比,逻辑曲线也被称作饱和的指数增长曲线。逻辑曲线的提出者为弗·纳里莫夫(Γ.Bлэдуц)和格·弗莱托茨(B.Hалимов),基本内容是文献的增长是阶段性的。初始阶段的文献增长契合指数增长规律,但并不是一直保持指数增长趋势,而是当文献量增长到某一定值的时候,其增长率开始变小,最后阶段文献缓慢增加。最终提出逻辑曲线增长理论模型如下
式中, F ( t )是时刻 t 的文献累积; k 是文献累积量最大值; α 、 b 是参数值。
当 t 较小时逻辑曲线与指数曲线相似。在曲线的最初阶段,科技文献是近似按照指数规律增长的。当 t 很大的时候,逻辑曲线趋近于一个固定值 k 。之后,不管经过多长时间,文献累计量只能无限的接近一个数值,但永远不会超过这个极限。从大量的实证结果中可以看出,逻辑增长规律具有一定的合理性,但也存在一定的局限性。
逻辑曲线的局限性体现为:首先,逻辑曲线是依据趋势外推法,在大量统计基础上得到的结论,未系统考虑科学交流过程的复杂性。其次,按照逻辑曲线增长理论,当科学发展到一定阶段时,文献增长率为零。这就意味着到某个年代再也没有新的科技文献出现。显然这是走向了另外一个极端,不符合实际。
(3)龚柏兹函数
龚柏兹函数是应用统计学家和数据学家龚柏兹(B.Gompertz)提出的用作控制人口增长率的一种模型,可以用来进行产品生命周期预测
。龚柏兹曲线描述的是初期增长缓慢,而后逐渐加快,当达到一定程度后,增长率逐渐下降,最后接近一条水平线。龚柏兹函数的数学表达式为
一阶导数为
因为 C ( t )>0,所以有 D >0;若该函数在 t >0时为单调递增函数,则有ln A ln B >0。
比较龚柏兹曲线与逻辑曲线可发现,二者的二阶导数均有达到最大值、最小值和零值三个特征点,这三个特征点能够揭示二者的实质差异
。在时间轴的开始阶段,龚柏兹曲线增长较为缓慢,其后则迅速增长,在时间轴的结束阶段,龚柏兹曲线的增长如同起始阶段一样增长缓慢。这一特征常用于描述受限空间的人口增长特征
,起始阶段因为人口基数小,所以增长缓慢,其后则快速增长,但不久后受到空间的限制,人口数量的增长又趋于缓慢。
Egghe与Rao基于1968—1987年间20个在线数据库中的数据累积发现:社会科学与人文类数据的增长符合龚柏兹模型
。Seetharam与Rao采用相同的方法对全球食品科学文献的增长进行研究,发现文献增长依然符合龚柏兹模型
。夏蓓丽将其扩展到微博这一社交媒体情境,基于龚柏兹模型研究“超女”博文的增长与老化特征
。
(1)推动因素
随着社会经济和科学技术的高速发展,信息的爆炸式增长不断地影响着人们对于信息的利用和吸收。科学信息的增长主要受科学自身所处的环境条件所影响
。第一,目前我们正处于社会化、移动化、网络化、物联化的社会,人们可以通过智能手机、移动终端、便携设备快速产生、分享和获取信息,并通过网络进行迅速地传播;第二,科学技术的不断发展,比如载体技术、出版技术、电子计算机、现代信息技术等;第三,科研经费和科技人员的大量增加;第四,专业范围的扩大化和细分化以及学科之间的渗透;第五,科研活动的成果产出与转化的增速;第六,通信技术、出版技术、情报工作等的发展。
(2)制约因素
信息增长的制约因素主要包括用户需求因素和信息环境因素。首先,用户需求因素。用户对信息的需求是信息增长的根源,但随着信息复杂程度增加且质量参差不齐,用户对信息的需求开始降低或开始有选择性。其次,信息环境因素。信息环境瞬息万变,导致信息的增长存在不确定性。例如科学文献的增长不仅按照科学自身的发展规律进行,还受到各种信息环境的制约,而这些制约使科学文献表现出随机过程的特点,使信息呈现出多种增长模式。
信息不会无节制地传播,其影响力存在一定时间、空间范围内,也就是说信息的价值会随着传播的进程不断老化。关于文献信息的老化规律研究最为成熟,本节仍以文献信息为例介绍信息老化规律。通常,文献信息老化有四种情形:文献中信息仍有用,但被包含在更新的其他论著中;文献中信息仍有用,但处于人们对其兴趣下降的领域;文献中信息仍有用,但被后来著作超越;信息不再有用。
(1)半衰期
1958年,英国物理学家、科学学家贝尔纳(J.D.Bernal)建议使用物理学中测度放射性核素寿命长短的指标——半衰期,衡量情报学中的文献老化程度。文献老化的半衰期定义为某学科领域内尚在利用的全部文献中较新的一半是在多长时间内发表的。从定义来看,文献半衰期越小,该学科越倾向于引用近期的文献,侧面反映出学科内文献新陈代谢频繁。从计算方法来看,半衰期可以通过作图法、定量模型计算法得到。
①作图法。这种方法需要将统计数据制成引文频次分布表,之后以引文累积量或引文百分累积量为纵坐标,以被引文献的出版年龄为横坐标作图,在图中找到与纵坐标上引文累积量或百分累积量一半处的对应点的横坐标 T ,即为所求结果。
②定量模型计算法。对统计数据建立文献老化模型,再根据定义找出半衰期的计算公式,将相应数据代入求得结果。
(2)普莱斯指数
1971年,普莱斯(D.Price)对《科学引文索引》的数据进行统计分析,发现在调查年一年内所发表文献的全部参考文献中有一半文献是在近五年内发表的。据此,普莱斯提出了一个衡量各个知识领域文献老化的数量指标,即“普莱斯指数”。其计算公式为
P r (普莱斯指数)=出版年限不超过5年的被引文献数量/被引文献总量
普莱斯指数要优于半衰期和引文中值年龄,普莱斯指数扩大了半衰期的适应范围,它既可用于描述某一领域的文献老化,也可用作期刊、机构等的评价指标。普莱斯指数与半衰期相比:从功能上看是相同的,它们都是从文献被利用的角度出发来反映文献老化的情况;从数值上的表现却相反,普莱斯指数越大,半衰期就越短,文献老化速度就越快。
(3)负指数模型
负指数模型被用来衡量文献信息的老化,贝尔纳(J.D.Bernal)利用共时数据发现,文献被利用的程度与文献年龄的关系是负指数函数关系,表达式如下
式中,
C
(
t
)是
t
年所发表文献的引用频率;
t
是文献的出版年龄;
K
是常数,与学科性质有关;e是自然常数;
a
是文献老化率,与学科性质有关,且与文献半衰期有关系。实践证明,文献的老化从宏观上进行考察,基本上是遵循负指数定律的
。
文献信息的老化主要受到四个方面的影响:第一,文献增长。文献的增长和老化一体两面,从不同角度描述科学的发展,阐明科学知识的修正率。第二,学科差异。世界上93%~98%的科学杂志引用寿命为20年左右,但不同学科的文献老化速率差异甚大。第三,学科发展阶段的差异。即使是同一学科,不同阶段文献的半衰期也有差异。第四,信息环境和需求。不同信息用户对文献信息的需求不同,因而信息利用者的需求及所处的信息环境就十分重要。
(1)在文献管理中的应用
从信息增长的角度来看,科学文献信息增长规律的研究最早是出现在图书馆的文献管理中的。科学文献的数量以及未来的发展趋势在图书馆对于资料收集策略、经费分配、书籍期刊的购买等决策起着重要的指导作用。
从信息老化的角度来看,科学文献的老化规律能够指导文献情报服务效率的提升。将老化的文献从文献库中分离并剔除,一方面大大提高了有用文献的检索效率,减少老化文献对检索策略的影响;另一方面,图书馆的馆藏空间是有限的,大量的文献堆积将会导致藏书空间的拥挤,造成难以管理、流通差的问题。老化文献的剔除可以为馆藏空间腾出更多的空间,提高有用文献的利用率。因此,确定文献的老化在文献管理中至关重要。
(2)在科学研究和评价中的应用
文献数量的增长变化规律是科学知识发展的直接表现,对于文献数量增长规律的探索,其实质是对学科科学史发展的探索。很多对科学学及科学史的研究通过关注科学文献数量增长的规律来模拟总结某科学技术的发展过程及规律,如普莱斯指数等。因此科学文献的增长规律结合老化规律,可以完整地描绘科学发展的过程、速度及规律,更全面反映出科学发展历史中的知识继承以及当前科学发展所处的阶段。
从学科角度来看,文献信息的增长及老化与学科性质密切相关。根据文献的增长及老化趋势的指标数据,能够在众多学科中识别出重点学科、重点研究领域及其发展趋势,确定学科所处位置,找出“领头羊”学科。同时,也能发现短板学科,帮助制定相应的学科发展政策。从文献价值发现来看,文献的增长及老化指标有助于了解文献的特性,相关规律能帮助我们从时效性方面确定科学文献当前的价值。
(3)在科学发展预测中的应用
科学文献的增长规律是科技人员开展科学分析研究、掌握科技发展动态并进行科学预测的可靠手段。科学文献(如专利等)数量的增长能反映一个国家某项科学技术当前的发展水平。例如科技人员经常利用专利文献的发展变化来进行科学技术发展的分析。而从信息老化角度来看,有科学家认为,对信息老化问题的研究是建立在对已发表的文献进行分析的基础上,因此信息老化问题能够对未来的信息利用情况做出可靠的预测,支持科学决策。例如,对于半衰期较短的科学、技术,可以加强对相关学科或技术的报道、分析和传播。