两个随机变量X、Y,如果它们的概率分布可以表示为两个因子的乘积,且一个因子只含x,另一个因子只含y,那么我们就称这两个随机变量互相独立。这句话可能不好理解,我们换一种方式来表达,或许更好理解。
如果对∀x∈X,y∈Y,P(X=x,Y=y)=P(X=x)P(Y=y)成立,那么随机变量X、Y互相独立。
在机器学习中,随机变量为互相独立的情况非常普遍,一旦互相独立,联合分布的计算就变得非常简单。
这是不带条件的随机变量的独立性定义,如果两个随机变量带有条件,如P(X,Y|Z),它的独立性如何定义呢?这个与上面的定义类似。具体如下:
如果对∀x∈X,y∈Y,z∈Z,P(X=x,Y=y|Z=z)=P(X=x|Z=z)P(Y=y|Z=z)成立,那么随机变量X、Y在给定随机变量Z时是条件独立的。
为便于表达,如果随机变量X、Y互相独立,又可记为X⊥Y,如果随机变量X、Y在给定时互相独立,则可记为X⊥Y|Z。
以上主要介绍离散型随机变量的独立性和条件独立性,如果是连续型随机变量,则只要把概率换成随机变量的密度函数即可。
假设X、Y为连续型随机变量,其联合概率密度函数为f(x,y),f x (x),f y (y)分别表示关于X、Y的边缘概率密度函数,如果f(x,y)=f x (x)f y (y)成立,则称随机变量X、Y互相独立。