深度学习之模型设计：核心算法与案例实践最新章节_言有三著

2.3.5 卷积神经网络的基本结构配置

与传统的神经网络一样，卷积神经网络依旧是层级网络。通常来说，其包括数据输入层（Input Layer）、卷积层（Convolutional Layer）、激活层、池化层（Pooling Layer）、全连接层（Full Connection Layer）等。

1．数据输入层

虽然数据输入层本身并不属于网络结构，但是这里也有必要进行说明。与传统的全连接神经网络不同，卷积神经网络的输入层就是原始的图像，而非提取的信息，因此卷积神经网络是一个无监督的特征学习网络。

数据输入层主要对原始图像数据进行预处理，基础的操作包括去均值、灰度归一化等，除此之外，还会有一些数据增强相关的操作。

下面是一个典型的使用Protobuf协议进行配置的数据输入层，这是Caffe的深度学习模型配置文件。

可以看出，它的输入类型是ImageData，也就是原生的图像格式。其对应有两个网络参数，分别是image_data_param和transform_param。image_data_param配置了3个属性：source为输入训练文件路径，batch_size为训练的批处理大小，shuffle为是否采用随机操作。transform_param配置了3个属性：mean_value为RGB的均值，crop_size为输入训练图像的尺寸，mirror为一个数据增强操作，指水平的翻转，这些都是图像预处理参数。

2．卷积层

卷积层是网络的特征提取层。一般卷积神经网络包含多个卷积层，一个卷积层可以有多个不同的卷积核。首先通过多个不同的卷积核对图像进行处理，提取特征，每个卷积核会映射出一个新的特征平面，再通过非线性激活函数对卷积输出结果进行处理。

下面是一个典型的卷积层，一个卷积层包含两种参数——权重参数和偏移量参数，还配置了两个param属性，它们分别是上述两类参数的学习率属性的配置。可以看到，在convolution_param中，配置了num_output、pad、kernel_size、stride、weight_filler参数。其中，num_output为输出特征层的通道数目；pad为在卷积前进行的边界填充像素的行列数；kernel_size为卷积核尺寸；stride为卷积的步长；weight_filler为权重参数的初始化策略；bias_filller中配置的是偏移量参数的初始化方法。