在第 2 章中讨论的有些随机事件直接用数量来标志,如抽样检验灯泡质量试验中灯泡的寿命、某汽车 4S店每天的汽车销量、某车站上午 8:00—10:00 的乘客人数、消费者每月的价格指数等.而有些随机事件不是直接用数量来标志的,如性别抽查试验中所抽到的性别、消费者对某项产品的购买意愿等.
为了更深入地研究各种与随机现象有关的理论和应用,将样本空间的元素与实数对应起来,即将随机试验的每个可能结果 e 都用一个实数 X ( e )来表示.例如,在性别抽查试验中用实数“1”表示“男性”,用“0”表示“女性”.正如裁判员在运动场上不叫运动员的名字而叫号码一样,两者建立了一种对应关系,在数学上理解为定义了一种实值函数.一般来讲,此处的实数 X 值将随 e 的不同而变化,它的取值因 e 的随机性而具有随机性,这种取值具有随机性的变量称为随机变量.
定义 3.1.1 设随机试验的样本空间为 S ,如果对 S 中的每一个元素 e ,有一个实数 X ( e )与之对应(见图 3.1),这样就得到一个定义在 S 上的实值单值函数 X = X ( e ),称为 随 机变量 (Random variable).
图 3.1
X = X ( e )称为随机变量,基于两点原因:第一,它是定义在样本空间 S 上的函数,是因变量;第二,随机变量的取值由试验结果确定,因试验的各个结果发生有一定的概率,故随机变量的取值有一定的概率,这个性质显示随机变量与普通函数之间有着本质的差异.另外,普通函数定义在实数集或实数集的一个子集上,而随机变量定义在样本空间上(样本空间的元素不一定是实数).
通常,以大写字母如 X , Y , Z , W ,…表示随机变量,以小写字母如 x , y , z , w ,…表示随机变量的取值.事件{ X = a }的含义是使得随机变量 X 取 a 值的所有样本点构成的集合,即
根据随机变量取值的不同,定义两种类型的随机变量:离散型随机变量和连续型随机变量.离散型随机变量所取的可能值是有限个或无限可列个,所有取值可以逐个一一列举,如随机变量 X 记为“某批产品中取到次品的个数”“某急救站收到的呼叫数”“产品抽样时直至抽到次品的次数”等.连续型随机变量的取值可能连续地充满某个区间甚至整个数轴,如随机变量 X 记为“轮胎的使用寿命”“测量某零件尺寸时的误差”等.后续章节将分别研究这两类随机变量,另一类奇异型随机变量这里不作介绍.
随机变量概念的产生是概率论发展史上的重大事件.引入随机变量后,随机试验中的各种事件就可用随机变量来描述.对随机现象统计规律性的研究,就由对事件及其概率的研究转化为对随机变量及其取值规律的研究.
例 3.1.1 将一枚硬币抛掷 3 次,观察出现正面( H )和反面( T )的情况.
(1)求恰好有 2 次正面的概率.
(2)求至多有 1 次正面的概率.
解 样本空间 S = { HHH , HHT , HTH , THH , HTT , THT , TTH , TTT },以 X 记 3 次投掷得到正面 H 的次数,则 X 是样本空间 S 上的随机变量.样本点和随机变量的函数值见表3.1.
表 3.1
随机变量 X 的可能取值不一定能逐个列出,有时只需要讨论 X 落在某个区间的概率,并不需要知道 X 取某个值的概率以及确定的概率分布.例如,求某高校学生的身高介于 1.6 m和 1.7 m之间的概率,如果用随机变量 X 表示学生的身高,即求 P {1.6 < X ≤ 1.7}的大小.这类问题可归结为研究随机变量 X 落在区间( x 1 , x 2 ]上的概率 P { x 1 < X ≤ x 2 }.
对概率 P { x 1 < X ≤ x 2 }的讨论就归结为计算概率值 P { X ≤ x }.不难看出,概率值 P { X ≤ x }随着 x 的不同而变化,它是 x 的函数,称为分布函数.
定义 3.1.2 设 X 是随机变量, x 为任意实数,函数
称为 X 的 分布函数 (Distribution function).
分布函数的几何意义如图 3.2 所示.若把 X 看作数轴上随机点的坐标,则分布函数 F ( x )在 x 处的函数值就表示 X 落在区间(-∞ , x ]上的概率.
图 3.2
对任意实数 x 1 , x 2 ( x 1 < x 2 ),有
若已知 X 的分布函数,就能知道 X 落在任何一个区间( x 1 , x 2 ]上的概率.在这个意义上,分布函数完整地描述了随机变量的统计规律性.
分布函数具有以下基本性质:
① F ( x )为单调不减的函数.
当区间端点 x 沿数轴无限向左移动( x →-∞ )时,“ X 落在 x 左边”这一事件趋于不可能事件,概率 P { X ≤ x } = F ( x )趋于 0.当 x 无限向右移动( x → + ∞ )时,事件“ X 落在 x 右边”趋于必然事件,概率 P { X ≤ x } = F ( x )趋于 1.
③ F ( x + 0) = F ( x ),即 F ( x )为右连续函数.
反过来可以证明,任何一个满足上述 3 个性质的函数,一定可以作为某个随机变量的分布函数.
利用分布函数可以方便地计算事件的概率.例如,
引进随机变量和分布函数以后,就能利用高等数学的许多结果和方法来研究各种随机现象.随机变量和分布函数是概率论的两个重要而基本的概念.