购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.1 随机网络模型

本节对几种典型的随机网络模型进行介绍,包括ER随机网络模型、P1/P2随机网络模型以及指数随机网络模型等。

2.1.1 ER随机网络模型

ER随机网络模型是离散型的无向网络 [1] 。简单地说,是在一个包含 n 个节点的网络中,选择 N 条边,每条边拥有相同被选中的概率 p 。这样依靠概率随机构成的网络被称为随机网络模型。在同一时期,Gilbert [6] 也提出了相似的定义:在 n 个节点的网络中,选择 N 条边,每两个节点之间按相同的概率连接成边。图2-1展示了在10个节点间分别以0.1、0.5、1的概率在节点间连接成边所形成的随机网络示例。

图2-1 随机网络示例

随机网络可以理解为一个概率空间,概率空间中的每个点都是一个网络。随机网络概率空间 的定义如下:此空间中的网络以独立概率 p i 包含边 e i ,其中0≤ p i ≤1。换句话说,概率空间 中的网络集,是由节点集 V =[ n ]中所有2 m 个的网络组成。下面给出随机网络的严格定义。

对于一个网络族 ,其中 G i 代表族中的一个网络,Pr( G i )代表网络 G i 出现的概率,并且满足0≤Pr( G i )≤1和∑ i ≥1 Pr( G i )=1。对随机网络的概率空间而言, G i 被称作网络族 中概率为Pr( G i )的一个随机网络。

考虑由固定节点集合 V ={1,2,…, n }构建的概率空间。由于 V 中的每个节点是可区分的,因此 V 上的边也是可区分的,进而同构的网络不能视作同一个网络。注意到节点集 V 中的完全图网络 K n 中包括的子网络个数见式(2-1),其中通项对应恰好有 k 个节点的子网络个数,最后一项对应由所有节点生成的子网络个数。

E ={ e 1 e 2 ,…, e m }表示在节点集 V =[ n ]上的完全图网络 K n 中所有边,其中 。因为边是可区分的,所以在节点集[ n ]中的网络数量是2 m

对于空间中一个具体的网络 H,E H )={ e j j S },其中 S ⊆{1,…, m }是网络 H 中边的索引集,那么网络 H 出现的概率为

也就是说,网络 H 中的每条边都会被选取, 中的每一条边都不会被选取。记 q j =1- p i ,G p 1 ,…, p m )代表概率空间 中的一个随机网络,则:

为了说明 确实是一个概率空间,下面进行验证

p 1 = p 2 =…= p m = p 时,将概率空间 记作 。在概率空间 中,有 k 条边在特定网络 H 中出现的概率是 p k (1- p m-k ,即网络 H 中的 k 条边都被选取, 中的每一条边都不被选取。记 G p 中的一个随机网络,则:

式中 e H )代表网络 H 中边的数量。在概率空间 中,空网络 出现的概率是1,其他任意网络出现的概率都为0。相似地,在概率空间 中,完全图网络 K n 出现的概率是1,且只有完全图网络 K n 会出现。相比于前两个极端的例子,当0< p <1时,在节点集 V =[ n ]中的任意网络出现的概率都大于0。当概率 p 从0逐渐上升到1时,随机网络 G p 从空网络进化到完全图网络。

Erdos和Renyi将 定义为由节点集 V =[ n ]构成的有 e 条边的随机网络。集合 中包含 个恰好有 e 条边的网络,其中 。当给定集合 中所有的网络都是等可能时, 便成为一个概率空间。若记 G e 为概率空间 中的一个随机网络,对于一个特定的网络 H ,则:

其中, G e = H 表示 G e 恰好是特定的网络 H ,不包括与 H 同构的网络。

有趣的是,若 e 相等或接近,当 n →∞时,概率空间 与概率空间 差异也会随之变小。但在大多数证明中,在概率空间 的计算要比在概率空间 的计算简单。

2.1.2 P1随机网络模型

ER随机网络提供了最原始的随机网络构成,由节点与按概率生成的边所组成。在现实的社会关系中,人与人的关系通常是有向的。为了将随机网络模型应用于有向网络中,发展演变出了P1随机网络模型 [3] 。在友谊关系网络中,一条从节点 i 到节点 j 的有向边,表示个体 i 认为个体 j 是他的朋友。图2-2展示了一个具有4个节点和6条有向边的有向网络。如果把图看作一张由4人构成的有向好友关系网络,那么1说2和4是他的朋友,2说3是他的朋友,以此类推。显然,上一节中的ER随机网络未考虑交互的方向性,难以对本例进行分析和刻画。为此,针对构建有向随机网络的模型,提出了P1随机网络。其通过参数,刻画节点间有向边的相互关系以及每个节点所表现出的对其他节点的吸引力差异,并且这些参数在节点和有向边数量不同的有向网络之间具有直接的可比性。

图2-2 友谊关系网络

现介绍有关有向网络的符号表示。 X ij 代表节点 i 对节点 j 的关系。用上文中的“友谊关系网络”举例。 X ij =1表示节点 i 认为节点 j 是朋友, X ij =0则相反。约定社会关系网络中没有指向自己的有向边,于是对于任意 i ,都有 X ii =0。用邻接矩阵表示图2-2的网络关系则如表2-1所示。

表2-1 友谊关系网络中的邻接矩阵

P1模型的建立源于社会网络研究中的经验观察。为了更精确地描述经验观察的结果,需要介绍描述网络的更多符号。令:

代表节点之间往复、对称或相互关系的数量。令:

代表节点 j 的入度,直观理解是指向节点 j 的有向关系数量,其中 g 是网络中节点的总数。同时定义网络中节点的平均度 ,入度的方差 V (in),其中

同理,节点 i 的出度则为

出度的平均值与方差和入度的平均值与方差类似。

研究发现相互关系 M 和入度方差 V (in)通常超过了它们的期望值 [7] 。经验主义社会计量数据似乎总是显示出相互关系的“过剩”,而某些网络中的成员总是设法吸引“过剩”的相互关系。Moreno提出了一种简单的零假设模型 [7] ,以社会计量数据中网络的出度为基准,生成具有相同出度的有向随机网络,并且每个网络的生成概率相等。通过提前给定节点的出度为{ X i + }来表示这样的概率分布。通过条件期望来限制网络的生成,那么在零假设分布下相互关系与入度方差可以表示为

当控制了网络节点的出度,理想情况下网络的相互关系 M 和入度方差 V (in)应该在期望附近。但实际表现出明显的大小关系,可见仅控制网络节点的出度是不能完全控制网络的特性。将上述期望与实际社会网络中的相互关系 M 和入度方差 V (in)比较,说明了有向网络中的边不是随机分布的。事实上有向网络的边展示出了非随机性的现象。从直觉和实质性的理论考虑,许多社会关系是互惠的。在互惠的社会关系下,网络表现出非随机性,因为相互关系 M 的值要大于它的期望。在无法往复的社会关系下,比如权力,相互关系 M 的值小于它的期望。类似地,不同节点表现出不同的吸引力,导致出现吸引更多关系的“星星”节点,以及吸引更少关系的“孤立”节点。这就会导致实际网络中的入度方差 V (in)会大于它的期望。

从这些观察中受到启发,P1随机网络建立了能控制网络分布的参数族。参数族将指数分布作为选择,是因为指数分布能明确地将足够多的统计数据与参数绑定在一起。更准确地来说,令 G 表示 g × g 的邻接矩阵, X 是代表随机网络的随机矩阵。令 x 表示 G 中的一个点,设 p 1 x )是 G 中的概率函数:

其中, m,x ++ x i + x + j 是统计量 M,X ++ X i + X + j 在网络中的值。 ρ θ α i β j 是控制网络的参数, α i ,β j 满足∑ α i =∑ β j =0。这些参数控制了生成特定 M,X ++ X + j 值的网络的概率。函数 K ρ θ ,{ α i },{ β j })是一个根据参数变化的归一化常数,它确保 G 中的 p 1 x )之和为1。通常来说,指数分布可以满足上述的要求,但需要明确地计算出函数 K ,函数 K 可以从基本假设中推导得出。最终可以推导出网络中节点 i 和节点 j 之间有向关系二元组( X ij ,X ji )的概率函数为

其中, x 1 x 2 =0,1, i,j =1,…, n,i j

并且关系二元组( x ij ,x ji )被假定是相互独立的。

在进一步理解上述模型之前,从另一个角度观察。首先将 X 分解为 个二元组 D ij ,D ij =( x ij ,x ji ),其中 i j X 的分布可以通过给出二元组 D ij 的联合分布来确定。为了描述{ D ij }的联合分布,首先假设 D ij 是相互独立的。这样的独立假设意味着P1随机网络不能表达网络中小团体、层级等倾向,但能表达相互往复关系、差异吸引力的特点。P1随机网络因为具有表达往复关系和差异吸引力的特点,所以其描述的网络更加贴近现实生活中的网络。后有研究提出了经验证据表示,在大量的社会网络群体中,是可以满足上述独立性的假设。因此P1随机网络可以对现实中某些类型网络数据进行建模分析。P1随机网络的可处理性建立在独立性假设之上,在缺乏独立性假设时无法求解出网络的参数。

假设了{ D ij }的独立性之后,函数 K 以及参数 ρ θ ,{ α i },{ β j }都能推导求出。函数 K 使概率 p 1 归一化。参数 ρ 控制网络的往复性,又称作往复性参数,反映了网络中关系往复性的强度。当 ρ ij >0, X ji =1,则更容易观察到 X ij =1。参数 θ 控制着网络中边的密度,又称作密度参数。当 θ 越大网络中边的数量也会越多。参数{ α i }控制着节点的出度,又称作生产率参数。当 α i 为正且越大,节点倾向于具有较大的出度,或者说主动形成了关系纽带。当 α i 为负且越小,节点的外度趋向于零。参数{ β j }控制着节点的入度,又称作吸引力参数。当 β j 为正且越大,节点倾向于具有较大的入度,或者说节点主动吸引了关系。当 β j 为负且越小,节点的入度趋向于零。在表2-2中介绍了P1随机网络参数的特殊情况,对应于便于理解的矩阵 G 上的分布。

表2-2 参数值特例以及在网络中相对应的解释

其中, p,p i ,p j 均表示 P X ij =1); m ij 表示 P D ij =(1,1)), i j a ij 表示 P D ij =(1,0)), i j n ij 表示 P D ij =(0,0)), i j

图2-3给出由不同参数生成的P1随机网络示例,表2-3和表2-4分别显示了示例中的参数与示例中的统计量,从中能更加直观地观察参数对网络统计量的影响。在示例中的所有四种情况都设定 ,设定四种不同的网络参数,反映了P1随机网络的不同特征。在示例1中除 θ 外的其他参数都设定为0,观察到的 M V (in)值接近它们给定{ X i + }分布的期望值,因为 ρ =0, β j =0。在示例2中,节点具有不同吸引力,其中节点1、2、3吸引力最高,节点8、9、10吸引力最低。由于 ρ =0,所以相互关系 M 值接近期望值,因为 β j ≠0,网络中的节点具有不同的吸引力,所以入度方差 V (in)比期望值更大。在示例3中, ρ =2, β j 与示例2中的相同,因此该网络具有往复性和差异吸引力的特性。 M V (in)都超过了它们的期望值。示例4除了 ρ =-2其他均与示例3相关,因此网络具有远离往复性的特性, M 相比它的期望值更少, V (in)相比它的期望值更高。虽然这四个例子没有展示模型的概率,但是说明了通过变化P1随机网络的参数,能够独立地改变往复性和差异吸引力。P1随机网络能够有效地反映社会关系网络中的往复性与差异吸引力,因此也具有了拟合分析网络的功能,是一种有效的网络建模模型。相比最原始的随机网络,改进无向网络为有向网络,设定了边的生成指数分布和相应参数,能够反映现实社会关系网络的特性,并且能进行调控。

图2-3 P1随机网络示例中的邻接矩阵

表2-3 P1随机网络示例中的参数

表2-4 P1随机网络示例中的统计量

2.1.3 P2随机网络模型

针对P1随机网络独立性的假设,P2随机网络 [4] 完成了P1随机网络在完整网络数据分析上的延伸,继承了P1随机网络表达的往复性与差别吸引力,进一步将这两个概念与二元组属性相互联系。模型考虑了数据的相互依赖性以及解释变量之间的关系,允许包含协变量,并通过随机效应对剩余可变性进行建模。P2随机网络处理由所有参与者的定向关系和属性组成的社会关系系统,即使在关系数据不完整的情况下,该模型也适用。P2随机网络的目的是将邻接矩阵数据与协变量联系起来,同时考虑特定的网络结构。这需要一种能处理网络数据相关性的二元逻辑回归模型。P2随机网络在P1随机网络的基础上,允许往复性参数 ρ 与密度参数 θ 在不同节点关系中变化,记为 ρ ij θ ij 。此外,参数 α i β j ρ ij θ ij 进一步采用协变量建模。

首先针对节点参数 α i ,β j ,生产率和吸引力参数的线性回归模型中包含协变量和随机效应:

式(2-17)和式(2-18)表达了一个观点,即生产率参数(社交能力)和吸引力参数(受欢迎程度)取决于节点的属性(分别用 X 1 X 2 表示),并给予分别的权重 γ 1 γ 2 。由于节点属性不能完全解释生产率和吸引力参数所有的变化,所以引入残差项 A B 。残差项 A B 是期望为0,方差分别为 的正态分布的随机变量,分别由 n ×1的 A i B i 组成。参数 可以代表现实中无法解释现象的方差,即考虑协变量 X 1 X 2 影响后 α β 的方差。同一节点的生产率和吸引力参数是相关的,令cov( A i ,B i )= σ AB 。不同参与者的参数是独立的,令cov( A i ,A j )=cov( B i ,B j )=cov( A i ,B j )=0, i j 。如果没有关于节点的外部信息,则 X 1 γ 1 X 2 γ 2 项消失, 分别决定了 α β 的方差。这样纯随机效应模型的结果是,除了往复性参数和密度参数外,只有两个方差参数和一个协方差参数。因此,没有协变量的P2随机网络模型比参数可解释的P1随机网络模型更简洁。但P1随机网络因为具有更多的参数,所以对现实网络的拟合比P2随机网络的拟合更好。

更多的参数使得假设条件增强,P2随机网络模型建模往复性参数与密度参数、节点的属性线性相关,属性分别用 Z 1 Z 2 表示。密度参数如下:

因为往复性是两个节点之间的特性,因此假设往复性参数在两个节点间对称, ρ ij = ρ ji ,往复性参数如下:

其中, Z 2 ij = Z 2 ji 。上述两个参数方程都包含一个常数和变量部分,不同的节点属性用来建模密度参数与往复性参数。

P2随机网络模型是P1随机网络模型的扩展,考虑了节点与二元组的属性以及随机效应。与P1模型相比,P2模型假设具有完整的网络数据,当随机确定某些关系或属性时,将删除对应的边或节点。P2模型最重要的特点是它的网络参数与二元组数据相关,正是相关性的假设使得P2模型区别于其他模型,但同时也使得P2模型难以估计。

2.1.4 指数随机网络模型

指数随机网络模型 [5] 是研究网络结构的统计模型,常用于说明网络中关系出现和不出现的原因,为分析网络结构提供了一个模型。指数随机网络模型对既定网络构建一些小的局部关系结构,例如互惠关系或三角关系。社会网络被看作是基于这些局部关系结构而构成的,这些局部关系结构也被称为“网络构局”(Network Configuration),同时对应于模型中的参数,图2-4中给出了构局的图例。这些构局被认为来自局部社会过程,在局部社会过程中,网络中的节点形成属于它们自己的与其他节点的联系方式。指数随机网络模型是对社会网络建模的一个原则性统计方法。一个给定网络中模型的构建要求解释网络结构的出现,比如趋同性过程、互惠过程、传递性过程以及这些过程的组合。通过参数将网络结构出现的原因引入一个模型中,可以检验是哪种效应起到决定性的作用,从而推断出构建这个网络的社会过程,例如推断网络中与期望相比,是否有更多的(或更少的)互惠关系或三角关系。

大量社会网络分析通过各种概括性度量来表示一个网络,例如边的数量、往复边的数量、中心性度量、三方组谱系等。这些概括性度量被称为“网络统计量”,指数随机网络模型就是根据这些统计量赋予图不同的概率:

在指数随机网络模型中一个给定网络 G 的概率是通过网络统计量 z i G )的加权求和计算, θ i 表示权重, c 代表归一化常数。网络统计量是对给定的网络中构局的数量计数,或者那些网络技术的函数。网络中的构局是网络中的局部子图,因此网络出现的概率取决于存在多少这样的构局,并且权重参数会反应每种构局的重要性。

研究者通过选择一组具有理论意义的构局来设定一个指数随机网络模型,可能会用到许多似乎合理的构局,然后把这个特定的模型应用到观测到的社会网络中,得到网络构局的参数。参数估计出后,则可以对网络中数据中的构局进行推断,进而可以对创建和维护网络重要的社会过程的类型进行推断。指数随机网络提供了对网络结构和过程进行实证研究的一种方法。指数随机网络是一类模型,如同回归模型选择自变量一样,需要设定与网络结构相关的构局。因此指数随机网络也承载了有关网络、社会网络的概念以及网络是如何创建的元理论。

指数随机网络模型满足社会网络的部分基本理论假设,比如网络是局部涌现的、结构化的和随机的,网络关系之间存在依赖等。指数随机网络模型的明确特征是:网络关系是相互依赖的,也就是网络自组织性,因此一条关系的出现将影响其他关系的出现,同时社会网络中定义的个体是相互依存的。指数随机网络通过假设网络关系之间存在相互依赖,使相互依赖关系的表示更近了一步,正是这样的假设形成了指数随机网络中重要的模式——参数化的构局。

指数随机网络模型是关于网络、网络过程和社会结构假设的理论,可以把它看作网络元理论,其本质是通过小的局部亚结构累计,最终通过个人关系形成这些亚结构的模式,来研究社会网络结构的形成。模型最重要的目的是解释社会网络中的关系模式,这种以关系为基础的方法可以解答一些问题,但不能解决全部问题。标准的指数随机网络模型侧重于揭示可以推断关系形成过程的模式,包括社会选择的过程;在该过程中,从网络行动者的属性来预测网络关系。图2-4展示了有向网络中构局的一些说明性例子。互惠性图例中两个节点相互之间的双向箭头表示两个行动者之间是往复关系。传递性闭合图例中展示了一个特定的三元结构中的关系传递闭环。扩张性图例中展示了一个从中心节点向外扩张的结构,从中心节点发出两条关系连接到另外两个节点。聚敛性图例展示了一个入星构局,中心节点受到外部两节点的关系连接。入星构局往往用网络的“聚敛性”描述,反映了网络的入度分布。趋同性图例中行动者具有相同的属性,还具有往复关系,并且具有相同属性的节点更容易形成往复关系。

图2-4 指数随机网络中构局的图例

网络构局的重要性在于能够表示潜在的社会过程中重要的模式。在指数随机网络模型中所研究的构局是局部的。网络关系介于一对节点之间。如果要了解网络关系的形成,需要关注节点对,而不是针对单个节点。因此指数随机网络模型对社会网络来说是以关系为基础的模型。支持指数随机网络模型的一个基本要素是网络关系之间的依赖性。如果缺乏关系间的依赖性,就不会出现关系模式形成的倾向。因此,假定构局为重要的网络模式就是假定网络关系之间的依赖性。如果关系之间彼此并不相互依赖就没有形成构局的动力。 eBPwGsVVGASYuS2y4z1fWHyhgEc6BlluykcRWnHZPW10RP7oUvJi9aF4gzkR5XsL

点击中间区域
呼出菜单
上一章
目录
下一章
×