2.1.3 VGGNet_深度学习视频理解-QQ阅读男生历史网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

2.1.3　VGGNet

VGGNet（Simonyan & Zisserman,2015）是2014年ImageNet 竞赛分类任务的亚军网络和定位任务的冠军网络，其中最常见的VGG-16（也被称为VGG-D）的网络结构如图2-4所示。VGG-16 共有16 层卷积和全连接层，共有1.38亿个参数。VGGNet 取名源自作者所处的英国牛津大学（Oxford University）的VGG（Visual Geometry Group，视觉几何组）研究组。

图2-4　VGGNet 网络结构图

VGGNet的网络结构十分简单，整个网络中的卷积层都采用了的卷积核，汇合层都采用了的卷积核。使用这种小卷积核的优势在于，堆叠两个卷积层可以得到的感受野（Receptive Field）大小，堆叠3个卷积层可以得到的感受野大小，但是和直接使用一个或卷积层相比，堆叠多个卷积层的参数量更少。

具体地说，对于一个标准的卷积核维度为、输入通道数为、输出通道数为的卷积层，其输入特征维度为，输出特征维度为，忽略卷积层的偏置项（Bias），该卷积层的参数量为，计算复杂度为。假设卷积层的输入输出特征维度都是，如表2-1所示，可以看出，在获得相同大小感受野的条件下，使用两个卷积层的参数量和计算量是使用一个卷积层的；在获得相同大小感受野的条件下，使用3个卷积层的参数量和计算量是使用一个卷积层的。