上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第2章 经典网络结构回顾
图像分类(Image Classification)是视频理解的基础,第3章和第4章介绍的动作识别算法会以图像分类网络作为基础骨架(Backbone),2.1节将对经典的图像分类网络的重要思想和设计理念进行快速回顾。另外,视频可以看作是由一组图像帧(Frame)按时间顺序排列而成的数据结构,RNN(Recurrent Neural Networks,循环神经网络)对时序数据(Sequential Data)有很强的建模能力,2.2节将介绍RNN和它的两个重要变种,即LSTM(Long Short-Term Memory,长短期记忆网络)(Hochreiter & Schmidhuber,1997)和GRU(Gated Recurrent Units,门控循环单元)(Cho et al.,2014)。