购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 社交网络与在线社交网络

1.1.1 社交网络

社会网络是由社会个体成员之间因为互动而形成的相对稳定的关系体系,是由许多节点构成的一种社会结构。节点通常是指个人或组织,社会网络代表各种社会关系,经由这些社会关系,把从偶然相识的泛泛之交到紧密结合的家庭关系的各种人或组织串联起来。社会关系包括朋友关系、同学关系、生意伙伴关系、种族信仰关系等。随着互联网技术的飞速发展,大量的社交平台将社会网络延伸到虚拟空间中,并形成了规模庞大的社交网络。

2004年之后相继上线的微博、微信、抖音、Facebook、YouTube、Twitter等社交媒体平台改变了人们获取信息的方式和途径,使人之间的信息分享从物理世界的人际关系网络转变为虚拟社交网络。截至2023年4月,Facebook的月活跃用户数为29.89亿。椐据CNNIC互联网研究中心公布的最新2022年版第49期《中国互联网络发展状况统计报告》,截至2021年12月,我国网民规模已达10.32亿,同时互联网普及率也已达到73.0%。在线社交网络是一种以互联网为基础,由用户集合及用户之间基于相互认识、兴趣爱好或个人崇拜等因素建立的连接关系从而构成的复杂社会性结构 [ 1 ] 。社交媒体(网站、APP等)已经成为人们日常生活中不可或缺的部分,人们借助在线社交网络建立自身的“社交身份”,对外发布信息和获取外部的信息,从而达到与其他人交流的目的。以微信为例,当用户给列表好友发送信息时,对方可以接收信息,也可以转发该信息,该信息从而沿着好友关系的关系结构传播开。在线社交网络的方便性和广泛性引起了各领域的广泛关注,人们通过社交网络分析(social network analysis)对网络中的信息进行获取、处理和预测,运用信息学、数学、社会学、管理学等多领域的知识,从信息传播的角度理解人类的社交关系结构、行为特点和信息传播规律等,为人们研究群体属性、应急突发事件等提供了方法依据。

社交网络 是指社会个体成员之间通过社会关系结成的网络体系。图1.1表示了信息传播过程,形象地说明了现实社交网络中信息如何在个体之间传播。个体在网络中表示为节点,可以是组织、个人等实体,或网络ID等虚拟个体。个体间的连接关系在网络中表示为边,边可以是个体与个体间的双向或单向的信息交流等 [ 2 ] 。在互联网出现之前,人们已经对传统社交网络的信息传播展开研究,许多领域都对信息传播有着一定的研究,例如,生物医学领域对病毒传染的研究和动物学对动物行为传播的研究等。

图1.1 信息传播

1.1.2 在线社交网络

近年来,随着在线社交服务的快速发展,社交网络进入我们社会经济生活的各个方面,演变为无处不在的计算平台和信息传播平台。为理解社交网络运行机制的各个方面,本书聚焦分析社交网络运行演化过程中紧密联系的一系列关键性要素——社交网络的结构属性及其演化规律、社交群体及其互动规律和网络信息及其传播方式,探讨社交网络分析的科学问题,介绍社交网络分析研究所面临的问题与挑战,并对社交网络的研究方向进行展望。

信息检索

在社交网络中,用户面对大量的网络信息,并非都是自己感兴趣或者想要获取的信息,因此如何从冗杂的信息中检索到自己想要的信息,便需要对信息检索进行研究。 信息检索 (information research,IR)是从大量的非结构化数据集(通常主要是存储在计算机中的文本)中检索信息(通常是文档)的过程,为了满足用户对信息的需求 [ 3 ] 。不同于传统结构化数据库,非结构化数据库没有明显结构标记的数据,如自然语言文本等,用户可以通过检索系统搜索文本或图像,从而获取想要的信息。

信息检索的目的是从文档集中返回和搜索相关的文档,相关程度被称为文档和查询之间的相关性。信息检索系统通常根据文档与查询之间的相关性对文档进行排序,再返回给用户。但查询结果的精确度往往还需要进一步修改,用户可以对查询进行扩展或重新制定,还可以在返回的检索结果中进行相关性反馈和评价等。

信息传播

在社交网络中,信息传播需要以用户之间的社交关系为基础,沿着社交网络传递信息。信息传播以真实存在的用户朋友关系为基础,不断向外扩展网络中用户个体的社交范围,形成一个大规模的社会化网络。从传播学的角度来看,社交网络信息传播过程中的信源与信宿、传播信息、传播范围、传播媒介、传播方式等都有自己的特殊性 [ 2 ] 。在社交网络中,当信源发送或分享一条消息时,朋友们会在不同时刻看到该消息,而且感兴趣的人会以一定的概率转发它。

目前对信息传播的研究也颇多,在刻画流行程度、分析信息的传播机制、信息溯源、预测结果等方面都有较多成果 [ 1 ] 。宏观上来看,信息在网络中的传播通常用流行度衡量;微观上来看,信息从一个节点传播到另一个节点,形成了信息级联。而由于信息的复杂性,相比于正面信息,会对人们生活造成不良影响的负面信息往往更容易被关注。本书将在已有研究的基础上,对在线社交网络的负面信息的传播进行研究。

情感分析

在线社交网络情感分析有着广泛的应用,随着网络社交媒体的发展,越来越多的人愿意在社交平台上发表自己的观点和情绪,因此一部分研究采用自然语言处理等方法,对网络用户的观点进行分析,这便是情感分析。社交网络情感分析属于观点挖掘的范畴,它根据用户在社交网络中的行为(如评论、口碑等),以逻辑学、语言学、心理学理论为基础,采用自然语言处理等方法,分析用户对实体(如产品、服务、个人、事件等)表达的观点、情绪和态度 [ 2 ] 。但大量的数据也会对情感分析算法造成一定的挑战。

流程图1.2描述了情感倾向分析的过程。首先,文本数据经过分词处理,生成词语序列。然后,这些词语被匹配到包含程度副词、正面情感词、负面情感词和否定词的词库中。接下来,结合这些词语和复杂规则来综合分析文本内容,从而得出情感倾向。比如,利用情感分析对消费者关于消费的产品及服务的观点。对淘宝、京东等商品的评论区进行分析,从而对产品的质量、销售和服务进行分析,并据此制定推广计划。但是,商家也会通过红包等一些措施改变消费者的真实评价,从而对真实的情感分析产生误导。情感分析也可应用到政治领域、金融市场以及评价交易系统等。比如,近年来对社交平台的青少年言论分析,通过该群体对一些热点时事的看法进行情感分析,从而对青少年的价值观采取更有针对性和合理性的引导措施。

图1.2 情感倾向分析流程图

热点追踪

在线社交平台的交互性、非线性、强关系等群组化传播特征,使得对于热点事件话题,人们更容易通过网络传播极端信息;同时正面负面双向信息的交互,使得社交网络成为热点事件极端信息传播的温床,导致大面积群体的负面情绪产生 [ 4 ] 。由于社交网络具有交互性、参与性、公开性等特性,因此为信息传播提供了跨时空和低成本的媒介。社交网络承载着大量的信息和受众群体,成为热点事件爆发的主要信息源。热点事件主要基于现实社会中的某种现象或问题产生,而且事件的发生具有很强的偶然性。当社会事件在网络上被曝光后,可能会引发用户较多的关注并被用户快速传播,进而成为热点事件。图1.3形象地展示了热点跟踪。用户会参与话题互动(如评论、点赞、转发等)来表达自身的价值观念及诉求,进而促进信息的传播。同时,社交网络是信息传播的重要渠道,对用户的情绪和价值观有一定的影响。因此,研究社交网络热点事件的传播机理及传播影响因素具有一定的理论与现实意义。

图1.3 热点跟踪

影响力最大化

影响力最大化问题 (influence maximization problem)是一个在社交网络中寻找一组种子节点,以使信息或影响力通过这些节点的传播能够覆盖尽可能多的其他节点的优化问题。影响力最大化问题广泛应用于病毒式营销、信息扩散、舆情引导等领域,该问题确定网络中有影响力的用户的子集,解决如何有效地平衡时间消耗甚至内存成本之间求解精度的问题,以便为疫情检测、病毒式营销等现实问题提供解决方案。

2001年,Domingos和Richardson首次提出用马尔可夫随机场来模拟信息传播过程 [ 5 ] ,开始了对影响力最大化问题的研究。2003年,Kempe等将影响力最大化问题定义为一种top -k 的离散最优化问题,即找出影响力传播范围最大的 k 个种子节点 [ 6 ] 。研究最大化问题常用的传播模型包括独立级联模型、线性阈值模型和触发模型等。基于这些模型,学者们提出基于贪心算法、启发式、反向影响集抽样和上下文感知等的算法 [ 7 ]

图1.4展示了一张简单的社交网络图。其中,较大的节点代表被选为种子节点的用户,这些用户在网络中的位置和连接度通常较高,他们在传播信息或影响力方面更为关键。通过这样的网络图,我们可以观察到影响力如何从中心节点向外扩散,并通过节点间的连接实现广泛的覆盖。正确地选择种子节点和深入理解网络结构是实现影响力最大化的关键。

图1.4 社交网络图 FXzCsGQ9R/18v9MA1Ptag3lsF5xFocp+XRSptzzi2kSFJELNPMX90MHZYcGvlkFq

点击中间区域
呼出菜单
上一章
目录
下一章
×