2023年5月,“郴州某村镇银行倒闭了”的虚假信息在网络平台散布,引起群众恐慌,导致该银行储户取现人数激增,伴随银行门口排队的短视频流出,事态持续恶化。某些网络短视频主播为了吸粉引流,不惜弄虚作假,捏造新闻博取关注,造成巨大的社会不良影响,甚至还触犯法律红线。2023年, Nature Neuroscience 发表了Jiang等 [ 114 ] 在认知科学研究领域的研究成果表明,在人类大脑整合社会网络上传递的信息以进行决策的过程中,那些更加“四通八达”的信息源施加更高的权重,低估甚至忽略可能掌握了部分真理的其他信息源,这种策略可能导致虚假信息的传播和错误共识的形成。在虚拟网络世界那些阴暗角落滋生的顽疾,正在影响和改变着公众的认识和行为,进而引发实体空间中的抢购、挤兑和舆情等突发事件,严重危及社会公共安全、金融安全和意识形态安全等。因此,开展虚拟网络空间中的虚假信息传播对实体空间的作用机制,以及虚实交互的一体化治理策略研究具有重要的现实意义和理论价值。
人工智能技术正以摧枯拉朽之势重塑各行各业,2023年的大语言模型ChatGPT、2024年的文生视频大模型Sora都给人类的认知带来巨大冲击,其中的应用场景和商业价值巨大,然而科技是一把双刃剑,自动生成技术为虚假信息文本和视频的制造与传播提供了便利,也为虚假信息的传播提供了温床,放大了观点上的极端化,带来对实体空间的冲击。因此,研究虚假信息在虚拟网络空间与实体空间之间的传播机制,掌握虚假信息的滋生、传播与相变规律,进而探寻一体化的治理策略具有重要的理论意义和应用价值。
研究学者从定性和定量两个角度对虚假信息的传播机理开展研究,其中就蕴含着大量的非线性组合优化问题,尤其是非次模集合函数的优化,求解难度大,原创性的方法必将推进相关领域的快速发展。定性视角下,Vosoughi等 [ 26 ] 对比了2006年到2017年Twitter中真实信息和虚假信息的传播差异,得出结论:虚假信息比真实信息传播得更快、更广。
然而信息的多样性使得社交网络的内容良莠不齐,虚假信息、虚假广告、网络谣言是网络世界的顽疾,尽管我国有相关法律和司法解释,但其仍野蛮生长并成为社会的公害。虚假信息通常是不真实的或有误导性的。哈佛大学教授David M.J.Lazer 2018年在 Science 上发表了题为“The Science of Fake News”的文章,其中提到Twitter上的虚假信息通常有更多人转发,比真实信息传播更迅速,文章呼吁科学家应当促进跨学科研究,以减少虚假新闻的传播,并揭示它所潜在的传播机理 [ 115 ] 。因此,开展社交媒体中的虚假信息治理研究具有重要的现实意义和应用价值。
以微信为例,大量的微信群聚集了不同画像(熟悉、相同爱好或需求等)的人,这种网络单个规模不大,但是信任程度较高、兴趣观念较一致,更容易形成从众效应,这使得社群网络也成为虚假信息传播的重要载体。社交网络的同质性也会使得网络中的用户更加倾向于和自己兴趣、观点一致的用户交流。这使得在信息传播过程中,信息在同一个圈子中形成闭环而封闭,从而形成回音壁效应。另一方面,同质化的社交网络减少了人们对其他观点的容忍度,放大了态度上的极端化,更可能接受与已有信息相容的新闻,并逐渐将新信息拒之门外,这种趋势造就了虚假信息能够吸引大量受众的环境 [ 116 ] 。有时对错误信息的纠正反而会强化人们对错误信息的坚持,纠正的结果也可能适得其反。
负面信息的传播会与正向信息产生竞争传播关系,因此,网络中的过量负面信息会造成所产生的信息量完全超过人类的消化水平。再加上由于经济利益或政治利益的诱惑,在媒体的推波助澜下,整个媒体舆论环境变得更加不堪。除了这些外部因素,人类在信息传播中出现的认识与心理学上的弱点,也加剧了虚假信息的泛滥。虚假信息泛滥给网络信息生态系统的安全带来严重的威胁。负面舆论对当事人会带来心理、经济以至人身安全上的负面影响;对政府而言,负面舆论会严重影响其公信力与权威性;对社会而言,会造成社会恐慌等群体事件,激化不同群体间的矛盾,误导舆论走向,影响社会的正常运作和决策。负面经济新闻可能引发市场恐慌,导致股市波动,对经济稳定产生不利影响。总之,负面信息的广泛传播对个人心理健康、社会和谐以及经济稳定都具有潜在的负面影响。对虚假信息传播机制的深入研究及寻求相关的对抗方法已刻不容缓 [ 117 ] 。
在线社交网络的快速发展为负面信息的传播提供了快捷途径,打破了地域限制,潜在传播机理仍需要揭示 [ 115 ] 。学者从定性分析和定量建模两个角度对虚假信息的传播机理进行了研究。
定性分析的视角主要通过采集典型虚假信息案例,利用统计方法分析传播规律。斯坦福大学的Kumar等 [ 118 ] 采集维基百科的恶作剧虚假信息,分析了这类信息的传播特征和过程,提出了基于信息特征的检测方法。麻省理工学院的Vosoughi等 [ 26 ] 通过分析Twitter 2006年到2017年的真实信息和虚假信息的传播过程,证实虚假信息比真实信息传播速度更快、范围更广。Yang [ 119 ] 通过分析网络热点话题动态数据,提出信息传播过程上升期、峰值期和衰减期的三阶段过程。Vicario等 [ 120 ] 通过分析大量Facebook上阴谋论话题和科学性话题的传播过程,考察了错误信息被广泛接受和传播的原因,并对错误信息的传播生命周期给出了详细分析,提出了“回音壁效应”,即信息或思想在一个封闭的小圈子里得到加强。Shu等 [ 116 ] 详细阐述了虚假信息和假新闻研究的最新进展。
定量建模的视角主要通过建立信息传播模型对信息传播规律进行模拟仿真,包括借鉴传染病模型、系统动力学仿真、平方场模型以及基于图的传播模型等。Jin等 [ 8 ] 提出用户在面对虚假信息时存在易感(susceptible)、潜伏(exposed)、感染(infective)、康复(recovered)四种状态,构建了SEIR传播模型,通过对真实数据的训练学习得到模型的转移概率参数。然而与传染病传播规律不同,虚假信息的传播过程中往往会出现信息的夸大、扭曲。殷飞等 [ 121 ] 构建的谣言热度系统动力学模型建模方法,使用软件进行仿真并分析,结果显示政府公信力、媒体影响率、网民群体极化程度等变量都对突发事件网络谣言的传播具有较大影响。平方场理论是把环境对物体的作用进行处理,能把一个高维难解的问题转化为一个低维问题,是统计物理中重要的理论分析方法,当社会网络规模足够大、网络个体同质时,平方场模型用来刻画谣言传播模型 [ 8 , 121 , 122 ] 。基于图的传播模型因其简练直观,在应用方面较为广泛,其中最普遍的是独立级联模型 [ 123 ] (independent cascade model,IC)和线性阈值模型 [ 124 ] (linear threshold model,LT),它们将社交网络表示成有向图 G =( V , E , P ), V 是节点集合, E 是表示关联关系的边集合, P 是边上的权重,表示节点之间的影响概率,同时将信息传播过程看成离散时间轴上的迭代过程。以IC为例,初始种子集合(信息传播源)是 S ,令 S t 表示截止第 t ( t =0,1,2,…)步被激活(节点被激活代表该节点接受该信息,并继续传播该信息)的节点集合。在第 t 步, S t 中的任何一个节点 u 将尝试激活它的每一个未被激活邻居节点 v ,激活概率是 P ( u , v ) ,同时假定这种尝试激活的动作只存在一次 [ 123 ] 。Guille等 [ 125 ] 对信息传播模型的研究进行了综述。
研究者通过挖掘社交媒体数据,逐步发现虚假信息的传播特征及规律,“回音壁效应” [ 120 ] 、“过滤气泡” [ 9 ] 等作用越来越强,大量在线社交网络社群促使人们更容易受到所属群体的影响,称之为群组效应。现有传播模型对群组效应刻画欠缺,尤其是在基于图的传播模型方面,仍需要研究新的刻画方法与虚假信息传播定量模型,Zhu等 [ 126 ] 利用超图概念描述了信息传播过程中的从众效应(crowd influence)。
基于社交媒体环境的群体化、同质化特征,掌握虚假信息依托群组传播的机理,研究虚假信息的最优干预策略,对于提升应对措施的时效性和有效性具有重要的实际意义。
首先,有助于揭示社交媒体中群组虚假信息的传播机理。虚假信息在网络中传播具有独特的群体化和同质化特征,需要研究建立契合这些特征的传播模型。本书应用文献分析与案例分析,掌握典型的虚假信息传播特征,构建群组效应下的信息传播模型,揭示虚假信息在社群网络中传播的一般规律和机理。
其次,有助于实现非线性组合优化理论的创新,尤其是非次模函数优化理论。大量的应急管理实践问题的解决依赖于优化方法的创新,社交媒体中虚假信息治理中所涉及的干预策略优化均是典型的非线性组合优化问题,在计算复杂性方面大都是NP-困难的,追求理论创新是本书的核心目标。
首先,有助于提升社交媒体虚假信息的治理能力。网络空间出现虚假信息时,管理决策者通常利用阻断信息传播和发布辟谣信息的方式应对。本书所关注的关键节点与关键路径虚假信息阻断优化模型,将有助于精准给出阻断策略,既能有效阻断信息传播,又能降低阻断策略给用户体验带来的负面影响。同时辟谣信息发布源头的选择与多角度、多内容信息发布形式的策略研究,将有效提升干预措施的精准性和有效性。
其次,有助于拓展非线性组合优化理论的应用场景。本书在非次模函数优化方法的突破,将不局限于应用在社交媒体虚假信息治理领域,还可以拓宽到网络社区发现、自然语言处理、语义分析等领域,在解决机器学习和人工智能的一些现实问题中将有巨大的价值。