通常卷积层的滤波器个数会设定为4的倍数,总输出=笔数×W_out×H_out×滤波器个数,会使输出尺寸变得很大,因此会通过池化层(Pooling Layer)进行下采样(Down Sampling),只取滑动窗口内的最大值或平均值,换句话说,就是将整个滑动窗口转化为一个点,这样就能有效降低每一层输入的尺寸,同时也能保有每个窗口的特征。我们来举个例子说明会比较清楚。
以最大池化层(Max Pooling)为例:
(1)图6.7左边为原始图像。
(2)假设滤波器尺寸为(2, 2)、Stride=2。
(3)滑动窗口取(2, 2),如图6.7左上角的框,取最大值=6。
(4)接着再滑动2步,如图6.8,取最大值=8。
图6.7 最大池化层(Max Pooling)
图6.8 最大池化层—滑动2步