复杂网络理论是探索与揭示复杂系统规律的重要理论。关于网络的研究最早可追溯至1736年瑞士数学家Eüler的哥尼斯堡七桥问题。之后的两百多年里,学者们从不同领域对各种类型的网络展开了广泛研究。近年来,随着计算机技术的发展,人们发现真实网络既不是规则的,也不是随机的,而是具有一定规律的复杂网络。自1998年Watts等在《自然》上发表《“小世界”网络的群体动力行为》和1999年Barabási等在《科学》上发表《随机网络中标度的涌现》,有关复杂网络理论与应用的研究热潮被掀起来了。
复杂网络理论的研究对象来自不同学科领域的网络,包括社会网络、生物网络、技术网络、信息网络等。网络按照是否考虑节点间的作用方向,分为无向网络和有向网络。按照是否考虑节点间的作用强度,分为无权网络和加权网络。按照拓扑结构,分为规则网络、随机网络、小世界网络和无标度网络。规则网络是指具有规则性拓扑结构的复杂网络,如环状网络、全连通网络;随机网络是指节点采取随机连线的方式得到的网络;小世界网络和无标度网络是介于两者之间的网络。
目前,复杂网络理论的研究主要集中在以下3个方面:一是各类实际网络拓扑结构的实证研究,即研究网络静态结构的特征与规律;二是网络生成机制及演化模型的研究,即通过研究网络的生成规则,建立网络演化模型,模拟网络行为;三是复杂网络上的动力学行为研究,即研究建立在网络上的系统工作方式和原理,从而对现实网络进行有效的控制,如复杂网络上的传播、同步、博弈等。本书运用复杂网络理论分析共生网络结构特征与规律,并通过建模模拟共生网络的形成过程,涉及网络结构分析指标与复杂网络建模理论,下面对其作简要介绍。
网络是一种描述自然和工程的系统模型,是相互关联、相互影响并具有一定特征和功能的基本个体的集合,包括行为主体、关系、资源3个基本要素。通常网络采用图论理论表述,网络G由节点和边所构成,记为G=(V,E),其中V为节点集,E为边集,V中元素称为节点(node)或顶点(vertex),E中元素称为边、联系或连接。给定一个包含N个节点的无权网络,它可以唯一表示为一个邻接矩阵A:
通常,复杂网络结构可运用基本特征指标、静态结构特征指标和动力学特征指标刻画网络的特征与性质。基本特征主要由度和度分布、平均路径长度、集聚系数等指标描述;静态结构特征主要由中心性、介数、核数、核心—边缘结构、层级结构、社团结构度相关性等指标刻画;复杂网络的动力学特征刻画的是网络的可靠性、鲁棒性、传播性和同步性等属性。本书研究共生网络的静态结构,拟选取如下指标展开分析,以刻画共生网络的拓扑结构特征。
1)基本特征指标
①整体密度(density)。整体密度是指在整个网络中各个节点之间联系的紧密程度,反映了网络的整体聚集水平。对有向网络,其计算式为Den=E/[N(N-1)];对无向网络,其计算式为Den=2E/[N(N-1)],其中N为网络的规模,E为网络实际的联系数。
②度(degree)与平均度(average degree)。度是网络的重要属性,表示个体的影响力和重要程度,一般而言,度越大的节点,其影响力越大,在整个组织中的作用也越大;度定义为节点的连边数,节点i的度记为
;在有向网络中,度有入度和出度之分。网络的平均度定义为:
③度分布(degree distribution)。度分布表示一个随机选定节点的度恰好是某个特定值的概率,其分布函数用P(k)描述。在目前的网络研究中,3种度分布较为常见:泊松度分布,如随机网络的度分布;指数分布,即P(k)随着k的增大以指数形式衰减,P(k)∝e -k/λ ;幂律分布,即P(k)∝k -r ,其中r称为度分布指数。
④平均路径长度(average path length)。平均路径长度是指网络中所有节点之间的平均最短距离,这里节点间的距离指的是从一个节点到另一个节点所要经历的边的最小数目。平均路径长度衡量的是网络的传输性能与效率,其计算公式为:
其中,L表示平均路径长度,d ij 为节点i和j之间的最短距离。
⑤集聚系数(clustering coefficient)。集聚系数是用来描述一个图中的顶点之间聚集成团的程度的系数。具体来说,是一个点的邻接点之间相互连接的程度。节点i的集聚系数C i 描述的是网络中与该节点直接相连的节点间的连接关系,即与该节点直接相邻的节点间实际存在的边数占最大可能存在的边数的比例,其计算式为C i =2E i /[k i (k i -1)],其中E i 表示节点i的邻接点之间实际存在的边数。网络的集聚系数C,为所有节点集聚系数的算术平均值。网络的集聚系数C越大,表明整个网络中各节点之间形成短距离沟通的程度越大,网络中资源沟通越快捷,网络呈现明显的集团化趋势。
2)中心性特征指标
中心性(centrality)是衡量节点权力的尺度,测量网络节点的重要性或节点居于怎样的中心地位。中心性可分为度数中心性(degree centrality)、中间中心性(between centrality)、接近中心性(closeness centrality)和特征向量中心性(eigenvector centrality)。中心性又分中心度和中心势,中心度是对个体节点权力的量化分析,分为绝对中心度和相对中心度;中心势是对群体权力的量化分析。由于可通过软件Ucinet直接计算出结果,这里不给出这些指标的计算公式。
①度数中心性。度数中心性是指运用与个体直接关联的节点的数量衡量个体权力的指标,一般用Freeman算法计算。
②中间中心性。中间中心性测度的是节点对资源的控制程度,如果一个节点处于许多其他节点的最短路径上,就称该节点具有较高的中间中心度,它起着沟通其他节点的桥梁作用,可以通过控制或者扭曲信息的传递影响整个网络群体。
③接近中心性。接近中心性测度的是某节点是否容易受到其他节点的控制,如果一个节点与网络中所有其他节点的距离都很短,则称该节点具有较高的接近中心性。当研究对象不需要对直接关系进行考察时,接近中心性是一个有用的指标,但该指标不大适合较大的复杂网络,因此本书未应用其分析共生网络结构。
④特征向量中心性。特征向量中心性分析的目的是依据网络的总体结构,找出最居于核心的节点,它并不关注比较局部的模式与结构。
此外,还可运用凝聚子群分析网络是否具有核心结构。凝聚子群是指具有紧密、直接关系的一群行动者的子集合,把行动者划分到各个凝聚子群,是网络分析的重要内容。目前关于凝聚子群分析的方法较多,如核心—边缘(coreperiphery)、派系(cliques)、n-派系等。本书主要采用核心—边缘分析方法,目的是判别网络是否具有核心—边缘结构,分析原理采用的是Borgatti等人在文献中提出的相关模型。在对网络开展核心—边缘结构分析时,应对数据有大体的了解,初步判断网络是否具有核心—边缘结构。利用核心—边缘结构分析一般适用于分析只有一个核心的网络,对于有较多核心的网络,该方法一般找不出这些核心。
3)复杂性特征分析
复杂网络研究者在大量网络现象的基础上,抽象出两类复杂网络:无标度网络和小世界网络,为此形成了网络的无标度和小世界两个基本属性。
①无标度属性(scale-free character)。根据Barabási等人对万维网数据的统计分析发现,万维网的度分布服从幂律分布,在双对数坐标系中是一条下降的直线,由于幂律分布具有标度不变性,缺乏一个特征度值,因此,称度分布服从幂律分布的网络为无标度网络。判断一个分布是否为幂律分布,大多是观察双对数坐标下的分布图是否成一条直线。大量实证测量结果显示:无标度网络节点度的幂律分布系数r一般为1~4,不同r的网络,其动力学性质不同。
②小世界属性(small world character)。小世界概念来源于真实网络,很多网络虽然规模很大但节点之间的拓扑距离却往往很短,即具有小世界属性,如万维网、食物链网等。关于小世界现象最著名的实验是社会学家Milgram在1967年发现的“六度分离”现象,该实验表明,在美国每个人平均可通过6个认识的人找到任何一个想找的人。小世界网络是指与相同规模的随机网络相比,该网络具有较小的平均路径长度和较大的集聚系数。Sporns运用小世界系数e sw =(C/C ran )÷(L/L ran )转换后的不等式证明,即当网络满足C/C ran >L/L ran 时,则判断网络具有小世界特征。
复杂网络建模是复杂网络研究的重要内容之一,是对现实复杂网络本质特征抽象的过程,它是指用形式化的语言描述网络中主体之间的关系与演化过程,以更好地把握现实系统本质。长期以来,人们期望构造出能够反映真实网络的拓扑结构,从而运用网络模型理解现实世界中的复杂网络,然而很难找到一个恰当的模型,使其具有复杂网络的所有特征。
ER随机图和WS小世界模型网络的度分布可近似用泊松分布(poisson distribution)表示,该分布在平均度<k>处具有峰值,然后呈指数快速衰减,当k远大于<k>时,这样的节点几乎不存在。然而,Albert等人在对互联网研究时发现,互联网中80%以上页面的连接数不到4个,而占节点总数不到万分之一的极少数节点,却有1000个以上的连接,网页的度分布服从幂律分布,于是提出了无标度网络模型,也被称为BA模型,利用该模型得到的复杂网络节点度分布没有明显的特征长度,故称为无标度网络。无标度网络开辟了复杂网络研究的新途径,奠定了复杂网络演化模型的基础,使人们认识到各种复杂系统的网络结构都遵循某些基本规则,从而为研究复杂网络结构寻找到普适性规律。为解释幂率分布的产生机理,Albert等人指出无标度网络的两个生成规则:增长规则,即网络的规模是不断扩大的;择优连接规则,即新节点更倾向于与网络中具有较高连接度的“大”节点相连。按照这两个关键生成规则建立的模型算法如下。
①增长(growth):网络初始状态具有较小数目m 0 个节点,在每一个时间步内,一个新的节点被引入网络,同时这个新节点与网络中m(m<m 0 )个老节点进行连接。
②择优连接(preferential attachment):新节点在选择节点连接时,有一定偏好,也就是说它选择某个节点i的概率∏ i 正比于这个节点的度,即:
在经过t个时间步后,网络节点数为N=m 0 +t个,边为mt条,BA无标度网络拓扑结构示意图及度分布如图2.1和图2.2所示。通过平均场理论可以证明,BA无标度网络的度分布服从幂律分布P(k)=2m 2 k -3 。
图2.1 无标度网络的拓扑结构示意图
注:来源于文献[119,122]
图2.2 BA无标度网络的度分布
注:来源于文献[119,122]
BA模型首次从演化的角度研究复杂网络宏观性质的起源,指出真实网络的宏观性质是由微观规则所导致的结果,由此引发人们对真实网络中各种宏观性质的微观生成规则、网络演化规律等问题的研究。十多年来,无标度网络研究无论是在实证方面,还是在理论分析与建模方面,都取得了丰硕的成果。然而,BA模型和真实网络相比存在明显的局限,例如,BA模型只能生成度分布指数为3的无标度网络,而各种实际复杂网络的度分布指数不甚相同,大都在1~4的范围内,且往往带有一些非幂律性;网络演化过程中只有节点的加入,却没有考虑原有网络的增边与删边情形;未考虑局域特性对网络演化结果的影响等。因此,在网络建模过程中,为了更好地刻画真实网络的性质,需要结合现实网络的微观规则或者局部性质进行修正后建模,常见的修正模型如局域世界演化网络模型、DMS(考虑吸引引子)模型、组合演化模型、适应度模型等。目前,基于无标度网络理论的建模方法已被应用到经济与管理领域,如王娜针对产业复杂网络、张纪会等针对供应链网络,运用修正的BA模型对所研究的对象展开建模与分析。
复杂网络理论是本书研究城市废弃物资源化共生网络的核心理论基础,本书基于复杂网络结构分析指标探讨了共生网络的结构特征与形成规律,基于复杂网络建模理论对共生网络展开了结构建模研究。