购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.3 长尾理论

3.3.1 长尾理论的提出

导入案例:长尾需求——亚马逊在长尾书中的市场

在图书市场中,流通的大多数书籍难以找到自己的目标读者。由于销量少,许多书店和出版商只能将畅销书作为经营的核心,关注“头部”图书,即“二八原则”,20%的图书支撑了80%的销售额。

与实体书店不同,亚马逊作为一家万亿美元市值的电子商务公司,其超过一半的图书销售量来自排行榜上13万名开外的图书。如果以亚马逊的销售数据统计为依据,这意味着那些并不在实体书店销售的图书要比那些摆在书店书架上的图书具有更大的市场。显然,亚马逊意识到了“尾部”图书的需求一直存在。在传统的图书销售中,货架、门店、消费者找书成本等供给瓶颈抑制了需求曲线的长度,并非真正的需求本身如此。而库存和销售成本近乎为0的亚马逊线上书店,做到了藏书量在百万以上,有限货架变成无限货架,降低搜索和获得成本,让消费者可以接触到更多的图书,大大拉长了被忽视的“尾部”需求。

2004年,美国《连线》杂志主编克里斯·安德森(C.Anderson)率先提出“长尾”(The Long Tail)。安德森基于亚马逊、Google、Netflix等电商企业销售数据与传统零售商销售数据对比,观察到在互联网企业的销售中,以数量、品种为二维坐标的需求曲线拖着长长的尾巴,向“品种”横轴尽头延伸,“长尾”因此得名 。这一理论颠覆了传统的“二八定律”。传统环境下,成本和效率的限制,使得人们只能将注意力放在最重要的人或事上。但在网络时代,很多资源的获取成本大大降低,“尾部”资源也能够以较低的成本获取,这进一步刺激了人们对这部分资源的需求。如果以海洋和陆地来形容市场,过去由于海平面的限制,人们只能接触到小部分的陆地;而到互联网时代,海平面的下降使得真正的需求曲线出现,被忽视的尾部越拉越长 。长尾理论示意图如图3-3所示。

图3-3 长尾理论示意图

3.3.2 大数据时代的长尾资源开发及应用

随着大数据时代的到来,长期被忽视的长尾资源的价值和潜力逐渐得到重视,主要体现在:首先,大数据时代数据量的急剧增加。数据爆炸式的增长使得长尾中的海量数据进入了人们的视野,数据背后的复杂逻辑和机理成为无法忽视的问题。其次,科学技术的进步和成熟,使海量长尾数据中低价值密度信息的开发成为可能。最后,互联网普及和应用。Web2.0时代的到来,互联网渗透到各个领域,互联网的便捷使得长尾部分在理论上实现了无限扩大,进一步加大了长尾数据的开发价值。

例如,科研活动中就存在典型的长尾现象。科研资助中80%的资金用于资助小投资项目,在CSSCI中,近80%的科学文献来自省、市级基金或无基金资助的成果,这些成果由于缺乏关注,因此其价值被长期忽视。Heidorn 在调查研究中指出,80%的科研活动处于科研活动长尾部分,并首次将长尾理论用于描述科学研究中的科学长尾数据,进一步理解科学研究活动中的灰色数据。例如:在科研产出中,20%的科研机构、团队、人员具有较高的科研成果产出,近80%的科研机构、团队、人员处在科研活动的长尾上;在科学期刊上,高影响力文章大多来源于20%的高影响力期刊,80%的期刊处在科研数据的长尾上而被忽视。然而80%的期刊也可能产生大量高影响力文章 ,小项目/机构的产出总和可能比大项目更多。因此,科学长尾数据的有效管护和利用能最大限度提高科学研究中的投资回报,使科学长尾数据发挥更大的科学价值

特别指出,隐藏在长尾中的“睡美人”文献也是一典型现象。根据二八定律,20%的科学文献贡献了80%的科学引用。科学论文的引用是科学论文影响力的体现,因此过去对于科学文献的研究重点关注高被引的头部论文。在发表后一段时间内没有或极少被引用的零被引论文作为长尾部分,一直存在于科学界,因零被引而一直被人们忽视。长尾理论的提出引起了人们对于尾部文献的思考:我们是否忽视了零被引文献的价值?通过绘制引文曲线,学者注意到有些论文发表后一段时间不受重视,多年后突然被大量引用,被学界称为“睡美人”文献。尤金·加菲尔德(E.Garfield)认为论文零被引的原因除了研究创新和质量较低外,也可能是研究内容过于超前或具有变革性而不被引用 。“睡美人”文献代表着科学成果的重大发现,已有研究表明,在1900—2012年的诺奖获得者发表的论文中,“睡美人”文献有758篇 。隐藏在无数零被引论文中的“睡美人”文献,其价值可能高于部分高被引论文。

延伸阅读资料:基于长尾关键词的领域新兴前沿探寻模型构建研究

领域新兴前沿是领域前沿的出生阶段,根据长尾理论,提出长尾关键词概念,能成为领域前沿的关键词往往从长尾关键词孕育而来,通过分析被忽略的具有重要价值的长尾关键词发现领域新兴前沿。

研究从生命周期角度出发,尝试从长尾关键词中探寻领域新兴前沿,提升领域前沿识别的时效性。根据领域新兴前沿特征,选择新颖性、成长力、催化力三个指标构建模型,为了更直观观测所探究的长尾关键词的潜力程度,通过构建战略坐标图,以可视化的方式对成长力和催化力指标进行展示并对领域新兴前沿进行预测。以图情领域核心期刊2009—2013年数据作为实验组,2014—2018年数据作为验证组进行实验。

根据关键词词频从高到底排序,共得到779个长尾词,根据新颖性指标筛选得到29个新颖长尾关键词。根据催化力指标与成长力指标构建战略坐标系(见图3-4),第一象限可以确定为领域新兴前沿,第二象限具有较高催化力和较低成长力,说明具有一定活跃度但需要得到核心研究者的关注,第三象限与第四象限关键词可能会逐渐退出领域研究。通过实验验证该模型能够将领域前沿的探寻时间提前至少2年,有助于科学研究的及时性。

图3-4 领域新兴前沿预测战略坐标系 bHxOb/qZmn3hgLCrhb5xx/Ro7HSMhjiA0UbwQTAZfv+63sszXV8epeOiD9qXmx/C

点击中间区域
呼出菜单
上一章
目录
下一章
×