现在我们知道,随机变量是一种具有不确定性的变量,可以取多个值,每个值都有一定的概率出现。那么,概率分布就是用来描述随机变量在不同取值情况下的概率分布情况的函数。
概率质量函数(Probability Mass Function,PMF)是一个离散随机变量的取值与其概率的对应关系。具体来说,对于一个离散随机变量X,其概率质量函数P(x)的定义为:
其中,x是X取值范围内的任意一个离散值,Pr(X=x)表示X等于x的概率。
概率质量函数满足以下两个条件。
(1)非负性:对于离散变量X的每个取值x,都有P(x)≥0。
(2)规范化:所有可能取到的离散值的概率之和等于1,即∑ x P(x)=1。
通俗地说,它可以告诉我们在一组可能出现的结果中,每个结果出现的概率是多少。
例如,如果我们考虑掷骰子的情况,骰子点数可以取1、2、3、4、5、6这六个离散值。每个点数出现的概率就可以用概率质量函数来表示。对于一个均匀骰子而言,每个点数出现的概率都相等,即P(1)=P(2)=P(3)=P(4)=P(5)=P(6)=1/6。
再举一个例子,假设我们有一组数据表示班级学生的成绩,成绩只能取整数,那么对应的概率质量函数可以告诉我们每种成绩出现的概率是多少。比如说,如果有5 名学生,其中有2名得到了80分,1名得到了70分,其余2人的成绩分别是60分、65分,那么80分的概率就是0.4,70分的概率是0.2,其他成绩的概率也可以通过计算得到,就像图3-3所示的这样。
图3-3 通过学生成绩的例子,可以更好地理解概率质量函数的概念
总之,概率质量函数是一个可以帮助我们了解离散型随机变量概率分布情况的有用工具。
为了帮助大家更好地理解概率质量函数的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是概率质量函数。
可以参考的ChatGPT提示词如下。
“概率质量函数是什么?”
“请用通俗易懂的语言,结合生活中的例子,介绍什么是概率质量函数。”
为了让大家可以用代码的形式学习概率质量函数的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。
要让ChatGPT生成代码,可以参考的提示词如下。
“请给出使用Python计算概率质量函数的示例代码,需要可视化。”
概率密度函数是描述随机变量概率分布的函数,通常用符号f(x)表示。对于一个连续型随机变量X,它的概率密度函数f(x)满足以下两个条件。
(1)非负性:f(x)≥0
其中,第一个条件保证了概率密度函数的取值非负,而第二个条件保证了所有可能出现的事件的总概率为1。
概率密度函数表示随机变量X取某个值的概率密度(即在该点的斜率),而不是实际的概率。因此,我们可以通过概率密度函数计算出某个区间内随机变量X出现的概率,这个概率可以通过对概率密度函数在该区间上进行积分来得到:
其中,a和b分别表示区间的下界和上界。如果要求随机变量X小于或等于某个值x的概率,则可以将上式中的上界b替换成x。
举个生活中的例子,假如我们想要了解某城市一天内的气温分布情况,可以使用概率密度函数来描述这个连续型的随机变量。在这种情况下,概率密度函数会给出每个温度范围内的可能性大小,例如在20℃到25℃之间的概率密度较高,而在35℃以上的概率密度较低。这样就可以帮助我们更好地理解气温的变化规律,就像图3-4所示的这样。
图3-4 概率密度函数可以让我们了解气温的变化规律
为了帮助大家更好地理解概率密度函数的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是概率密度函数。
可以参考的ChatGPT提示词如下。
“概率密度函数是什么?”
“请用通俗易懂的语言,结合生活中的例子,介绍什么是概率密度函数。”
为了让大家可以用代码的形式学习概率密度函数的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。
要让ChatGPT生成代码,可以参考的提示词如下。
“请给出使用Python计算概率密度函数的示例代码,需要可视化。”