购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.9 常用概率分布

在这一节中,我们一起来学习一些常用的概率分布。

3.9.1 Bernoulli分布

Bernoulli(伯努利)分布是一个二元随机变量X的离散概率分布,它只有两个可能的取值:0和1。该分布用于描述一个试验只有两种可能结果的情况。

在Bernoulli分布中,如果事件发生,则X=1;如果事件不发生,则X=0。这里需要注意的是,X=1并不代表事件成功,而只是代表它发生了。Bernoulli分布的参数为p,表示事件发生的概率。因此,概率质量函数可以表示为:

其中,p满足0≤p≤1。

在生活中,我们可以用抛硬币来举例说明——假设你和朋友玩抛硬币游戏,硬币正面朝上为事件A,反面朝上为事件B。根据Bernoulli分布的定义,这个游戏就符合Bernoulli分布的条件。因为每次抛硬币只有两种可能结果,即事件A或事件B,而且每次抛硬币的结果是相互独立的,就像图3-12所示的这样。

图3-12 抛硬币游戏,是生活中最常见的Bernoulli分布

假设硬币正面朝上的概率是p,那么硬币反面朝上的概率就是1-p。另外,如果我们抛了n次硬币,那么硬币正面朝上的次数就是一个二项分布,它可以由n个独立的Ber-noulli分布累加得到。

除了抛硬币这个例子,生活中还有很多其他的例子也符合Bernoulli分布的条件,比如投票。无论是哪种情况,只要存在着两种可能的结果,并且每次实验都是独立的,那么就可以用Bernoulli分布来进行描述。

原理输出3.12

为了帮助大家更好地理解Bernoulli分布的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是Bernoulli分布。

小贴士

可以参考的ChatGPT提示词如下。

“请介绍一下什么是Bernoulli分布。”

“请用通俗易懂的语言,结合生活中的例子,介绍一下Bernoulli分布的概念。”

实操练习3.12

为了让大家可以用代码的形式学习Bernoulli分布的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。

小贴士

要让ChatGPT生成代码,可以参考的提示词如下。

“请用Python生成一组符合Bernoulli分布的数据,并进行可视化。”

3.9.2 Multinoulli分布

Multinoulli分布,也称为分类分布或范畴分布,是一种离散概率分布。它表示在一个具有K个不同的可能取值的试验中,每个取值出现的概率。在机器学习中,Multinoulli分布通常用于描述多分类问题中每个类别的概率分布。

具体而言,如果一个随机变量X,它取值可以为1,2,…,K中的任意一个,并可以用一个K维向量P=(p 1 ,p 2 …,p K )来表示X的分布,其中p i 表示X=i的概率,且满足 。那么这个向量就是Multinoulli分布的参数,通常表示为:

举一个生活中的例子,假设你要去超市购买零食,你面前有若干种零食可供选择,比如薯片、巧克力、糖果等。你对每种零食的喜好不一样,有些你更喜欢,有些你不太喜欢,而且你的选择可能会受到价格和其他因素的影响。

现在假设你已经确定了要购买三包零食,那么你可以用一个长度为3的向量来表示你的选择,例如y=(1,2,3)表示你选择了第1种、第2种和第3种零食。则Multinoulli分布就是用来描述每种零食被选中的概率分布,即每种零食被选中的概率不同,且总和为1。比如,如果你更喜欢巧克力,那么选中巧克力的概率可能会更高,而其他零食的选中概率则相应减小,就像图3-13所示的这样。

图3-13 在超市里对不同零食的选择,可以看成是Multinoulli分布

总之,Multinoulli分布可以用来描述具有K个离散取值的随机变量的概率分布,这种随机变量在生活中很常见,比如投票、抽奖、购物等。

原理输出3.13

为了帮助大家更好地理解Multinoulli分布的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是Multinoulli分布。

小贴士

可以参考的ChatGPT提示词如下。

“请介绍一下什么是Multinoulli分布。”

“请用通俗易懂的语言,结合生活中的例子,介绍一下Multinoulli分布的概念。”

实操练习3.13

为了让大家用代码的形式学习Multinoulli分布的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。

小贴士

要让ChatGPT生成代码,可以参考的提示词如下。

“请用Python生成一组符合Multinoulli分布的数据,并进行可视化。”

3.9.3 高斯分布

高斯分布,也称为正态分布,是一种常见的连续概率分布。它在统计学和概率论中扮演着重要角色,因为许多自然现象都可以用高斯分布来描述。高斯分布的形状呈钟形曲线,并且具有一个平均值(也称为期望值)和一个标准差,它们共同决定了这个分布的特征。

在高斯分布中,大部分数值集中在平均值周围,并且距离平均值越远,数值越小。标准差表示数据偏离平均值的程度,如果标准差越小,则数据更集中;如果标准差越大,则数据更分散。高斯分布在科学、工程、金融等领域都有广泛的应用。

对于高斯分布,也可以用生活中一个常见的例子来解释。假设你每天骑自行车上班,需要花费一定的时间。如果我们把你每天骑车的时间记录下来,并将这些数据绘制成直方图,那么很可能我们会看到一个钟形曲线状的分布,这个分布就是高斯分布。

在这个例子中,钟形曲线的顶峰表示你平均需要花费的时间,而钟形曲线向两侧逐渐变平,则表示大部分时间你都能在这个平均值附近骑车到达公司。同时,由于路况、心情等各种因素的影响,有时候你的骑车时间会长一些,有时候又会短一些,所以数据的分布不是严格对称的,但整体呈钟形分布。这个钟形分布的宽度则表示你的骑车时间存在波动,即标准差越大,波动也越明显,反之亦然,就像图3-14所示的这样。

图3-14 一般来说,你每天骑车上班花费的时间,大致符合高斯分布

同样,高斯分布可以描述人群身高、学生成绩等现象。当我们收集到足够多的数据后,就可以根据这些数据得到相应的高斯分布,进而对这个分布进行分析和预测。

原理输出3.14

为了帮助大家更好地理解高斯分布的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是高斯分布。

小贴士

可以参考的ChatGPT提示词如下。

“请介绍一下什么是高斯分布。”

“请用通俗易懂的语言,结合生活中的例子,介绍一下高斯分布的概念。”

实操练习3.14

为了让大家可以用代码的形式学习高斯分布的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。

小贴士

要让ChatGPT生成代码,可以参考的提示词如下。

“请用Python生成一组符合高斯分布的数据,并进行可视化。”

3.9.4 指数分布

指数分布是一种连续概率分布,通常用于描述等待事件发生的时间间隔。指数分布的概率密度函数具有单峰、右侧截尾的特征,其形状取决于参数λ(λ>0),表示单位时间内发生事件的平均次数。指数分布是一种重要的概率分布,广泛应用于各个领域,如信号处理、可靠性理论、统计物理、金融和工程等。

让我们回到生活中的例子。假设你要去等待公交车,公交车到站的时间是服从指数分布的。具体来说,这意味着在某段时间内,公交车来到你所在的站台的概率是均等的,而每一次等待的时间长度则有可能是不同的。

例如,如果λ=0.1(1/0.1=10,即平均每10分钟会有一辆公交车),那么你等待5分钟的概率是比较大的,因为在这个时间段内,很可能有一辆公交车经过了。但是,等待30分钟以上的概率就相对较小了,因为在这段时间内已经有很多公交车来了,就像图3-15所示的这样。

图3-15 公交车到站的时间是服从指数分布的

可以看出,指数分布描述的是一个随机事件发生的时间间隔,而且该事件在任意时刻都可能发生。这种分布在生活中的应用还有很多,例如测量设备故障之间的时间间隔、评估客户到达服务中心的间隔时间等。

原理输出3.15

为了帮助大家更好地理解指数分布的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是指数分布。

小贴士

可以参考的ChatGPT提示词如下。

“请介绍一下什么是指数分布。”

“请用通俗易懂的语言,结合生活中的例子,介绍一下指数分布的概念。”

实操练习3.15

为了让大家可以用代码的形式学习指数分布的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。

小贴士

要让ChatGPT生成代码,可以参考的提示词如下。

“请用Python生成一组符合指数分布的数据,并进行可视化。”

特别说明:一个与指数分布联系紧密的概率分布是 Laplace(拉普拉斯)分布,Laplace分布是一种概率分布,用于描述连续随机变量的可能取值。它的形状类似于钟形曲线,但比正态分布更加陡峭、尖锐。Laplace 分布通常用于处理离群值较多的数据,因为它对离群值有较好的容忍性。

3.9.5 Dirac分布

Dirac分布,也称为Delta函数或单位脉冲函数,是在物理、工程和数学领域中经常使用的一种特殊函数。它可以看作一个在某一点上有无限大的峰值,其余部分为零的函数。Dirac分布通常用符号δ(x)表示,满足以下性质:

(1)在x=0处有无限大的峰值,且在其他地方都为零;

(2)δ(x)在任意区间上的积分等于该区间内包含0的个数;

(3) ,其中a是一个常数。

这样说起来可能比较抽象,但可以通过一个生活中的例子来帮助理解。假设你手上拿着一根长针,如果让它随机而自然地掉落,那么针最终会以某个角度与地面相交。这种掉落方式就类似于对某个角度区间取随机数。

现在,假设你想知道针与地面相交的概率有多大,具体来说,是针与地面夹角小于某个给定角度θ的概率。如果你掉落了很多根针并记录结果,最后会得到一个关于θ的概率分布函数,也就是每个θ值对应的概率密度函数。此时,如果将针的长度固定为常数,那么这个概率密度函数就会趋向于一个Dirac分布,就像图3-16所示的这样。

图3-16 多次扔一根针,针落地时与地面的夹角小于某个角度的概率,符合Dirac分布

Dirac分布在物理学中有广泛应用,尤其是在量子力学中。它可以用来描述粒子的位置、动量、角动量等物理量的测量结果。在信号处理中,Dirac分布被用来描述信号的瞬时功率、幅度谱等相关信息。

原理输出3.16

为了帮助大家更好地理解Dirac分布的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是Dirac分布。

小贴士

可以参考的ChatGPT提示词如下。

“请介绍一下什么是Dirac分布。”

“请用通俗易懂的语言,结合生活中的例子,请介绍一下Dirac分布的概念。”

实操练习3.16

为了让大家可以用代码的形式学习Dirac分布的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。

小贴士

要让ChatGPT生成代码,可以参考的提示词如下。

“请用Python生成一组符合Dirac分布的数据,并进行可视化。”

特别说明:Dirac分布经常作为经验分布的一个组成部分出现,经验分布是指根据给定的样本数据统计得到的一种概率分布函数,它反映了样本数据中各数值出现的频率和概率。简单来说,经验分布就是以样本数据为基础来估计总体分布的一种方法。

3.9.6 混合分布

混合分布是由多个基本概率分布按一定比例混合而成的概率分布。其中,每个基本概率分布称为混合成分或混合成分分布。混合分布可以用来描述真实世界中很多现象,比如人群的身高、体重等参数,都可以被认为是由多个不同的分布组成的混合分布。

在数学上,混合分布可以表示为以下形式:

其中,x是随机变量的取值,f(x)是混合分布的概率密度函数,k 是混合成分数量,w i 是第i个混合成分的权重,满足:

f i (x)是第i个混合成分的概率密度函数。

下面我们用生活中常见的例子来解释。假设现在我们要研究一个地区的人群身高分布,如果所有的人都是同一种身高分布,那么我们可以很容易地确定这个分布的概率密度函数。但是,实际上人群的身高并不完全相同,可能由于遗传、环境等多种因素影响,使得人群的身高分布会有所不同。

在这种情况下,我们就可以使用混合分布来描述不同身高分布的混合情况。例如,我们可以将这个地区的人群分成几类,比如男性和女性,或者年轻人和老年人等。每个群体内部的身高分布可以近似看作独立的,但是不同群体之间的身高分布可能存在差异,因此整个人群的身高分布可以被认为是由多个不同的分布组成的混合分布,就像图3-17所示的这样。

图3-17 不同年龄群体的身高,会组成混合分布

再举一个例子,假设我们要研究一种新药物的副作用,我们可以对多个患者进行观察,然后发现不同患者对该药物的反应存在差异。因此,我们可以将这些患者分成几类,比如按年龄、性别、体质等不同因素,然后观察不同类别患者出现副作用的概率分布。这样,整个群体的副作用发生情况就可以被认为是由多个不同概率分布混合而成的混合分布。

总之,混合分布是一种常见的概率分布形式,可以用来描述复杂的数据分布情况,例如人群身高、药物副作用等。

原理输出3.17

为了帮助大家更好地理解混合分布的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是混合分布。

小贴士

可以参考的ChatGPT提示词如下。

“请介绍一下什么是混合分布。”

“请用通俗易懂的语言,结合生活中的例子,请介绍一下混合分布的概念。”

实操练习3.17

为了让大家可以用代码的形式学习混合分布的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。

小贴士

要让ChatGPT生成代码,可以参考的提示词如下。

“请用Python生成一组符合混合分布的数据,并进行可视化。” O00onKgr40EUTfhd0DzHmX1FGJ8HJ1aL7O0haCLH9dNQPgQNxNFTV5vhaaTar9HM

点击中间区域
呼出菜单
上一章
目录
下一章
×