深度学习视频理解
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1.5 Inception V2/V3

Inception V2(Szegedy et al.,2016)在BN-Inception的基础上进一步改进网络结构。Inception V2和BN-Inception 都用了10个Inception模块,两者区别在于Inception V2 同时使用了图2-8中的3种模块。

img

图2-8 Inception V2和Inception V3中的Inception模块

● 在网络的前几层,使用3个图2-8(a)中的模块,该模块和BN-Inception中使用的模块相同,都是将 GoogLeNet中Inception模块中的img卷积用两个img卷积取代。相比于使用一个img卷积,使用两个img卷积有更少的参数量和计算量。

● 在网络的中间几层(对应特征空间维度为img),使用5个图2-8(b)中的模块,该模块进一步将img卷积分解成img卷积,相比于使用一个img卷积,使用img卷积有更少的参数量和计算量。这种非对称的卷积分解形式在网络前几层中作用不大,但是在网络中间几层(特征空间维度在imgimg之间)中效果很好。

● 在网络的后几层(对应特征空间维度为img),使用图2-8(c)中的两个模块,相比于原始Inception模块,该模块可以得到更多通道数的输出特征,以避免特征空间维度比较小时带来的信息损失。

Inception V3(Szegedy et al.,2016)在Inception V2的基础上,将网络最初的img卷积也分解为img卷积。此外,在全连接层后也使用了BN层,并且使用了标记平滑(Label Smoothing)训练技巧等。Inception V3计算量是GoogLeNet计算量的2.5 倍,而错误率较后者下降了3%。