定义1-14 : n 维随机向量。
定义 X =( X 1 , X 2 ,…, X n )为一 n 维向量,其每个分量,即 X 1 , X 2 ,…, X n ,都是一维随机变量,则称 X 是一个 n 维随机向量,或 n 维随机变量。
与随机变量一样,随机向量也有离散型和连续型之分。
设 X =( X 1 , X 2 ,…, X n )是一个 n 维随机向量,其取值可视为 n 维欧氏空间 R n 中的一个点,如果 X 的全部取值能充满 R n 中某一区域,则称它是连续型的。
定义1-15 :联合概率密度函数。
若 f ( x 1 ,…, x n )是定义在 R n 上的非负函数,使对 R n 中的任何集合 A ,有
则称 f 是 X 的概率密度函数,或称为 n 维向量( X 1 , X 2 ,…, X n )的联合概率密度函数。
在1.2.1节谈过,车辆耐久性工程中最重要的一类随机变量为车辆某处的某载荷对应的伪损伤密度 d 。车辆的行驶速度、路面不平度等,亦为随机变量,可用 X 1 , X 2 ,…来表示,这样 X =( d , X 1 , X 2 ,…, X n -1 )构成了车辆耐久性工程中非常重要的一个 n 维连续型随机向量;其每个分量,即 d , X 1 , X 2 ,…都是一维随机变量。这样一个 n 维连续型随机向量 X =( d , X 1 , X 2 ,…, X n -1 )是后续讨论的核心。
n 维正态分布是 n 维随机向量的一个重要例子和分布模型。以二维的情况为例,其概率密度函数为
式(1-17)中包含了五个常数( a 、 b 、 和 r ),它们是这个分布的参数,其可取值的范围为-∞< a <∞,-∞< b <∞, σ 1 >0, σ 2 >0,-1< r <1,常把这个分布记为 。
定义1-16 :边缘分布。
先考虑二维的情况。设 X =( X 1 , X 2 )有联合概率密度函数 f ( x 1 , x 2 )。因为 X 的每个分量 X 1 和 X 2 都是一维随机变量,故它们都有各自的分布 F 1 和 F 2 。这些一维分布 F 1 和 F 2 ,称为随机向量 X 或其分布 F 的“边缘分布”。
为了证明这一点,考虑 X 1 的分布函数(边缘分布) F 1 ( x 1 )= P ( X 1 ≤ x 1 , X 2 <∞),得
是且仅是 t 1 的函数,可以记为 f 1 ( t 1 )。于是上式可写为
两边对 x 1 求导,得到 X 1 的概率密度函数为
同理,可以求得 X 2 的概率密度函数为
推广到 n 维的情况:设 n 维随机向量 X =( X 1 , X 2 ,…, X n )有联合概率密度函数 f ( x 1 ,…, x n ),为了求某一分量 X i 的概率密度函数,只需把 f ( x 1 ,…, x n )中的 x 1 固定,然后对 x 1 ,…, x i -1 , x i +1 ,…, x n 在-∞到∞之间进行定积分即可,即 X i 的概率密度函数为
由上面的推导和分析可以看出,边缘分布 F i 完全由原分布(联合分布) F 确定,但是反过来则不然,也就是说,即使知道了所有 X i 的边缘分布 F i ,也不足以决定随机向量 X 的分布 F 。这是多维随机向量中非常重要的性质和结论。
举一个例子:考虑两个二维正态分布 N (0,0,1,1,1/3)和 N (0,0,1,1,2/3),它们任一边缘分布都是标准正态分布 N (0,1),但是,这两个二维分布是不同的分布,因为 r 的数值不相同。这个现象的解释是,边缘分布只分别考虑了单个变量 X i 的情况,而未涉及它们之间的关系,而这个信息却包含在( X 1 , X 2 ,…, X n )的分布之内,这将在第1.4节说明:式(1-17)中引入的 r 这个参数,正好刻画了两个分量 X 1 和 X 2 之间的关系。
定义1-17 :条件概率分布。
一个随机向量 X 的条件概率分布,就是在某种给定的条件下, X 的概率分布。设二维随机向量 X =( X 1 , X 2 ),有概率密度函数 f ( x 1 , x 2 ),在限定 a ≤ x 2 ≤ b 的条件下, X 1 的条件分布,有
这是 X 1 的条件分布函数,对 x 1 求导数,得到条件密度函数为
更有兴趣的是 a = b 的情况,即在 X 2 给定等于一个值时, X 1 的条件密度函数。可以采用极限步骤:
上式可以改写为
也就是说,两个随机变量 X 1 和 X 2 的联合概率密度,等于其中之一的概率密度,乘以在给定这一个时另一个的条件概率密度。这个公式可以类比于条件概率公式。
相应的,同样有
推广到任意维度的情况:假设有 n 维随机向量( Y , X 1 ,…, X n -1 ),其概率密度函数为 f ( y , x 1 ,…, x n -1 ),则
其中, g 是( X 1 ,…, X n -1 )的概率密度, h 是在给定 X 1 = x 1 ,…, X n -1 = x n -1 的条件下, Y 的条件概率密度。
把上式两边对 X 1 ,…, X n -1 积分,得
这个公式可以理解为: Y 的无条件密度 f Y ( y ),是其条件密度 h ( y|x 1 ,…, x n -1 )对“条件” g ( x 1 ,…, x n -1 )的加权平均。它可以看作全概率公式在概率密度这种情况下的表现形式。这里 f Y ( y )相当于全概率公式中的 P ( A ), h ( y|x 1 ,…, x n -1 )相当于条件概率 P ( A|B i ), g ( x 1 ,…, x n -1 )相当于 P ( B i )。
式(1-24)对于理解和处理车辆耐久性工程中非常重要的一个 n 维连续型随机向量 X =( d , x 1 , x 2 ,…, x n -1 )给出了重要的思路。在车辆工程中,非常关心伪损伤密度 d 的无条件概率密度 ,依据式(1-24)可得
式中, x 1 , x 2 ,…, x n -1 是选定的、对于 d 的取值和分布有重要影响的 n -1个维度,用这 n -1个维度去划分和描述不同的工况,张成所谓 n -1维的工况空间,并用 g ( x 1 ,…, x n -1 )来描述工况空间中各种工况的联合概率密度分布,这种概率密度相当于在 X 1 = x 1 ,…, X n -1 = x n -1 的工况条件下, d 的条件密度 的权重。 d 的条件密度对所有权重的加权平均,即得伪损伤密度 d 的无条件概率密度。
之所以需要经由这一思路和技术路线,是因为工程实践中直接去获取和统计伪损伤密度 d 的无条件概率密度 往往是不现实的,但是经由两个测试阶段分别统计和获取工况空间的联合概率密度分布 g ( x 1 ,…, x n -1 )和各个工况下伪损伤密度 d 的条件密度 x n -1 ),在经过艰苦的努力和数据积累之后是可行的,从而从统计理论上为获得 d 的无条件概率密度 指明了一条重要的和可行的技术路线。
先考虑两个变量 X 1 , X 2 的情况,并假设( X 1 , X 2 )为连续型。一般来说, f 1 ( x 1 | x 2 )是随着 x 2 的变化而变化的,这反映了 X 1 与 X 2 在概率上有相依关系的事实。如果 f 1 ( x 1 | x 2 )不依赖于 x 2 ,因而只是 x 1 的函数,暂记为 g ( x 1 ),则表示 X 1 的分布情况与 X 2 取什么值完全无关,这时就称 X 1 , X 2 这两个随机变量独立,即 f 1 ( x 1 | x 2 )= g ( x 1 )。此时,将该式代入式(1-21)有 f ( x 1 , x 2 )= f 2 ( x 2 ) g ( x 1 )。对该式左右两边 x 2 积分,有
也就是说, X 1 的无条件密度 f 1 ( x 1 ),就等于其条件密度 f 1 ( x 1 | x 2 ),这本身也可以作为独立性的定义。将这层关系代入式(1-21)有
上式也可以作为 X 1 , X 2 独立的定义,也就是说若 X 1 , X 2 独立,则其联合密度等于各分量密度之积。这一结论可以直接推广到多个变量的情形。
设 n 维随机向量( X 1 , X 2 ,…, X n )的联合概率密度函数为 f ( x 1 ,…, x n ),而 X i 的边缘密度函数为 f i ( x i ),如果
则称随机变量 X 1 , X 2 ,…, X n 相互独立。同样将在第1.4节说明:如果( X 1 , X 2 ,…, X n )是 n 维随机向量,服从 n 维正态分布,那么式(1-17)中 r 这个参数,对于判断随机变量 X 1 , X 2 ,…, X n 的独立性方面,发挥着非常重要和关键的作用。