购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

3.3.3 VGGNet

VGGNet是2014年ILSVRC分类任务比赛的亚军,是由Simonyan等人在AlexNet的基础上针对AlexNet进行改进提出的卷积神经网络。VGGNet的结构与AlexNet的结构极其相似,区别在于其网络深度更深,并且基本采用3×3的小卷积核,因此从形式上看更加简单。原作者通过对比不同深度的网络在图像分类中的性能证明了卷积神经网络的深度提升有利于提高图像分类的准确率,但是深度加深不能没有限制,当神经网络的深度加深到一定程度后继续加深网络会导致网络性能的退化。因此,经过对比,VGGNet的深度最终被确定在了16~19层。表3.3给出了原作者在论文中提出的几种网络结构。

表3.3 典型VGGNet结构

以上六种网络结构相似,都是由5层卷积层加上3层全连接层组成,区别在于每层卷积的子卷积层数量和卷积核大小不一样,从A到E类型网络,网络层数由11层逐渐增加至19层。表格中conv3-64表示64个卷积核大小为3×3的卷积层,大卷积层之间由最大池化(maxpool)隔开,FC-4096表示由4096个神经元构成的全连接层,最终输出层为Softmax层。在这六种网络中,D为著名的VGG16,E为VGG19。

图3.16所示为最经典的VGG16网络结构,VGG16总共包含16个子层,VGG16的输入层为224×224×3的三通道RGB图像,第1层卷积层由2个conv3-64组成,第2层卷积层由2个conv3-128组成,第3层卷积层由3个conv3-256组成,第4层卷积层由3个conv3-512组成,第5层卷积层由3个conv3-512组成,然后是2个FC-4096的全连接层,1个FC-1000的全连接层,总共16层。

图3.16 VGG16网络结构

VGGNet的一个重要特点是小卷积核。在AlexNet中,采用的卷积核相对都比较大,例如7×7的卷积核,但是在VGGNet中采用3×3的小卷积核来进行卷积计算,同时增加卷积层的层数来使得网络性能不会下降。使用多个小卷积核可以等效替代大卷积核,例如用3个3×3的卷积核,其感受野大小就与一个7×7的卷积核的感受野大小相等。但是使用小卷积核却会带来一些好处:

1)可以大幅度减小模型的参数量,例如使用2个3×3的卷积核来替代一个5×5的卷积核,对于5×5的卷积核,其参数量为5×5=25,而两个3×3的卷积核的参数量为2×3×3=18,仅为前者的72%。

2)可以增加卷积层数,而由于每个卷积层中都含有一个非线性激活函数,因此可以增加网络的非线性,模型中使用1×1的卷积核也可以在不改变模型感受野的情况下增加模型的非线性。

此外,由于VGGNet模型的通道数更多,而每一个通道就代表着一个特征图,因此通道数量的增加就意味着网络模型能够获取到更多的图像特征,能够获取到更丰富的图像信息。 uw6OvMnUwQc07tGG/PlSbVfCXpq4ezFnsaYyRo8lQHDko6T4sItPcsmArv4u3K3L

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开