深度学习视频理解
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2.1 RNN

我们使用下标img表示输入时序序列的时序位置,即不同时刻,用img表示在img时刻的系统隐层状态(Hidden State)向量,用img表示img时刻的输入。img时刻的隐层状态向量img依赖于当前词img和前一时刻的隐层状态向量img

img

(2.15)

其中,img是一个非线性映射函数。一种通常的做法是计算img的线性变换后经过一个非线性激活函数,例如:

img

(2.16)

其中,img是可学习的参数矩阵,激活函数img独立地应用到其输入的每个元素。

RNN的计算过程如图2-26所示,图中左边是输入img,右边是输出img。计算从左向右进行,整个运算包括3步:输入img并分别乘以img,两者结果相加,以及最后经过img非线性变换输出。

img

图2-26 RNN的计算过程

我们可以认为img存储了网络中的记忆(Memory),RNN 学习的目标是使得img记录了在img时刻之前(包含img时刻)的输入信息img。在新词img输入到网络之后,之前的隐状态向量img就转换为和当前输入img有关的img