上一节我们介绍了边缘概率,它是多维随机变量一个子集(或分量)上的概率分布。在含多个随机变量的事件中,经常遇到求某个事件在其他事件发生的概率,例如,在表4-1的分布中,假设我们要求在Y=0的条件下,求X=1的概率。这种概率叫作条件概率。条件概率如何求?我们先看一般情况。
设有两个随机变量X、Y,我们将把X=x,Y=y发生的条件概率记为P(Y=y|X=x),那么这个条件概率可以通过以下公式计算:
条件概率只有在P(X=x)>0时,才有意义,如果P(X=x)=0,即X=x不可能发生,以它为条件就毫无意义。
现在我们来看上面这个例子,根据式(4.10),我们要求的问题就转换为:
其中P(Y=0)是一个边缘概率,其值为:P(X=1,Y=0)+P(X=2,Y=0)=0.05+0.28=0.33,而P(X=1,Y=0)=0.05.故P(X=1|Y=0)=0.05/0.33=5/33
式(4.10)为离散型随机变量的条件概率,连续型随机变量也有类似公式。假设(X,Y)为二维连续型随机变量,它们的密度函数为f(x,y),关于Y的边缘概率密度函数为f Y (y),且满足f Y (y)>0,假设
为在Y=y条件下,关于X的条件密度函数,则
称为在Y=y的条件下,关于X的条件分布函数。
同理,可以得到,在X=x的条件下,关于Y的条件密度函数;
在X=x的条件下,关于Y的条件分布函数为: