深度学习视频理解
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 本章小结

本章首先对视频行业,特别是网络视频行业近年来的发展历程进行回顾,面对多种场景下积累的海量视频内容,视频理解技术可以对其进行智能分析。视频理解涉及许多任务,本书将对其中的3大基础领域进行介绍:动作识别、时序动作定位和视频Embedding。这3个领域可以看作是对应图像领域向视频领域的延伸,如表1-1所示。

表1-1 图像和视频相关领域对比

img

[1]有的资料翻译为池化。