贝叶斯网络表示的联合分布所需要的独立参数比一般的表示方法更少,其原因在于贝叶斯网络图结构中编码的 条件独立性 (conditional independence)假设 。条件独立性是2.3.1节中引入的独立性概念的泛化。当且仅当 P ( X , Y | Z )= P ( X | Z ) P ( Y | Z )时,变量 X 和 Y 在给定 Z 时条件独立。变量 X 和 Y 在给定 Z 时是条件独立的断言,可以记述为( X ⊥ Y | Z )。从这个定义可以证明,当且仅当 P ( X | Z )= P ( X | Y , Z )时,( X ∈ Y | Z )。给定 Z ,关于 Y 的信息不提供关于 X 的附加信息,反之亦然。示例2-6为这种情况的一个示例。
示例2-6 卫星跟踪问题中的条件独立性 。假设卫星轨迹偏差( D )的存在有条件地独立于是否存在通信损失( C ),前提条件是已知是否存在电气系统故障( E )。我们将上述情况记作( D ⊥ C | E )。如果已知电气系统发生了故障,那么观察到通信中断的事实不会影响我们认为存在轨迹偏差的信念。我们可能对轨道偏差有更高的期望,但这只是因为事先知道电气系统故障的发生。
我们可以使用一组规则来判断贝叶斯网络的结构是否需要满足在给定一组其他证据变量的情况下,两个变量必须是条件独立的 。假设我们希望检查贝叶斯网络结构是否隐含关系( A ⊥ B | C ),其中 C 是一组证据变量。我们必须检查从 A 到 B 的所有可能的无向路径,这就是所谓的d-分离(d-separation)。如果以下任一条件成立,则 A 和 B 之间的路径被 C 进行d-分离:
1.路径包含节点 链 (chain) X → Y → Z ,使得 Y 在 C 中。
2.路径包含一个 分叉 (fork) X ← Y → Z ,使得 Y 在 C 中。
3.路径包含一个 倒叉 (invertedfork,或称为v结构) X → Y ← Z ,使得 Y 不在 C 中并且 Y 的后代不在 C 中。示例2-7为该规则提供了一些直观演示。
如果 A 和 B 之间的所有路径都被 C 进行d-分离,则 A 和 B 被 C 进行d-分离。这种分隔意味着( A ⊥ B | C ) [13] 。示例2-8演示了检查该图是否包含特定条件独立性假设的过程。
示例2-7 节点链 、 分叉和倒叉中隐含(以及非隐含)的条件独立性假设的直观演示 。如果 X → Y → Z (链)或 X ← Y → Z (分叉)在 Y 处有证据,则 X 和 Z 是条件独立的,这意味着 P ( X | Y , Z )= P ( X | Y )。有趣的是,如果箭头的方向略有不同,如 X → Y ← Z (倒叉),则给定 Y 时, X 和 Z 可能不再是条件独立的。换而言之,可能存在 P ( B | E )≠ P ( B | S , E )的情况。为了表述更加直观,考虑从电池故障 B 到太阳能电池板故障 S ,通过电气系统故障 E 的反向分叉(倒叉)路径。假设我们事先知道发生了电气故障。如果事先知道并不存在电池故障,那么我们更倾向于相信目前存在太阳能电池板故障,因为这是电气故障的另一个原因。相反,如果发现确实存在电池故障,那么我们对太阳能电池板故障的判断力就会降低。这种效应被称为 通过解释排除原因 (explainingaway)。通过观察太阳能电池板是否故障可以排除电气系统故障的原因。
有时,使用节点 X 的 马尔可夫毯 (Markovblanket) [14] 表示满足下列条件的节点的最小集合:如果已知各个节点的值,则使 X 有条件地独立于其他所有节点。一个特定节点的马尔可夫毯由其父节点、子节点以及子节点的其他父节点组成。
示例2-8 图2-15所示的结构隐含了条件独立性假设。 假设我们想确定图2-15中所示的网络是否隐含条件( D ⊥ B | F )。从 D 到 B 有两条无向路径。我们需要检查这两条路径上是否存在d-分离。
图2-15 隐含条件独立性假设的网络结构
路径 D ← A → C ← B 涉及分叉 D ← A → C ,然后是倒叉 A → C ← B 。在 A 处不存在任何证据,因此分叉处不存在d-分离。由于 F 是 C 的后代,所以沿着倒叉也不存在d-分离。因此,这条路径上不存在d-分离。
第二条路径 D → E ← C ← B 涉及倒叉 D → E ← C 和节点链 E ← C ← B 。因为 F 是 E 的后代,所以沿着倒叉不存在d-分离。因为沿着这条路径的节点链中也不存在d-分离,所以沿着从 D 到 B 的这条路径也不存在d-分离。
对于给定 F 的条件独立的 D 和 B ,必须沿着从 D 到 B 的所有无向路径进行d-分离。在这种情况下,两条路径上都不存在d-分离。因此,网络结构中并不隐含条件独立性。