上一节中,我们学习了一些在深度学习模型中会遇到的概率分布。本节中,我们将继续学习一些常用于处理概率分布的函数。
Sigmoid函数的数学形式为:
其中:z=w 0 x 0 +w 1 x 1 +…+w i x i 是输入特征的线性组合,w i 是对应特征的权重,x i 是对应特征的取值。
Sigmoid函数将任意实数映射到(0,1)区间内的一个概率值,具有如下性质:
(1)当z→-∞ 时,δ(z)→0;
(2)当z→+∞ 时,δ(z)→1;
(3)在z =0处,δ(z)=0.5。
下面我们举个生活中常见的例子。假设你要判断一件商品是否受欢迎,你可以根据不同的因素(比如价格、口味、外观等)给出一个综合评分。这个评分可以使用Sigmoid函数来转换为概率值,表示该商品受欢迎的可能性有多大,如图3-18所示的这样。
图3-18 Sigmoid函数可以用来表示某件商品受欢迎的概率
综上所述,通过使用Sigmoid 函数,我们可以将任意实数映射到0到1 之间的范围内,方便进行二分类问题的处理,例如判断一封邮件是否垃圾邮件。同时,因为它具有一定的非线性特性,还可以用于多层神经网络的训练过程,提高模型的表达能力和拟合能力。
为了帮助大家更好地理解Sigmoid函数的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是Sigmoid函数。
可以参考的ChatGPT提示词如下。
“请介绍一下什么是Sigmoid函数。”
“请用通俗易懂的语言,结合生活中的例子,请介绍一下Sigmoid函数。”
为了让大家可以用代码的形式学习Sigmoid函数的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。
要让ChatGPT生成代码,可以参考的提示词如下。
“请用Python演示Sigmoid函数,并进行可视化。”
Softplus函数是一种常用的激活函数,通常用于神经网络中。它可以将输入值映射到非负数上,并保持单调递增。Softplus函数的公式如下:
其中,ln表示自然对数,e表示自然指数。由于其对输入值进行了非线性映射,Soft-plus函数有助于提高模型的表达能力。
在生活中,我们可以用一个简单的例子来解释这个函数:假设你每天工作了若干小时,你想要知道这些时间对你产生的压力有多大。我们可以使用Softplus函数来计算这个压力值,就像图3-19所示的这样。
图3-19 可以用Softplus函数表达工作时长与工作压力之间的关系
首先,我们把你每天的工作时间作为函数的输入x。然后,我们把这个时间值代入Softplus函数里计算出压力值。由于Softplus函数的输出值总是大于等于零的,所以这个压力值也不会为负数。
例如,如果你每天工作了8小时,那么我们可以用以下公式来计算你所承受的压力:
这里,我们使用了x=8来计算压力值,结果约为8.0003。这个数字表明,你每天工作8小时会给你带来一定的压力,但并不是很严重。
总的来说,Softplus函数是一种常用的激活函数,可以用于神经网络模型中。它能够将输入信号转换为非负输出值,因此在某些场景下可以更准确地表达信号的含义。
为了帮助大家更好地理解Softplus函数的概念,请大家按照前言中的方法录制一个长度约为2分钟的短视频,介绍什么是Softplus函数。
可以参考的ChatGPT提示词如下。
“请介绍一下什么是Softplus函数。”
“请用通俗易懂的语言,结合生活中的例子,请介绍一下Softplus函数。”
为了让大家可以用代码的形式学习Softplus函数的概念,接下来大家可以让ChatGPT生成示例代码,并在Colab新建一个Notebook文件运行这些代码。
要让ChatGPT生成代码,可以参考的提示词如下。
“请用Python演示Softplus函数,并进行可视化。”