LSTM详解

LSTM详解


LSTM是RNN的一种变种,可以有效地解决RNN的梯度爆炸或者消失问题。关于RNN可以参考作者的另一篇文章https://blog.csdn.net/qq_40922271/article/details/120965322

LSTM的改进在于增加了新的记忆单元与门控机制

改进

记忆单元

LSTM进入了一个新的记忆单元LSTM详解,用于进行线性的循环信息传递,同时输出信息给隐藏层的外部状态LSTM详解。在每个时刻LSTM详解LSTM详解记录了到当前时刻为止的历史信息。

门控机制

LSTM引入门控机制来控制信息传递的路径,类似于数字电路中的门,0即关闭,1即开启。

LSTM中的三个门为遗忘门LSTM详解输入门LSTM详解输出门LSTM详解

  • LSTM详解控制上一个时刻的记忆单元LSTM详解需要遗忘多少信息
  • LSTM详解控制当前时刻的候选状态LSTM详解有多少信息需要存储
  • LSTM详解控制当前时刻的记忆单元LSTM详解有多少信息需要输出给外部状态LSTM详解

下面我们就看看改进的新内容在LSTM的结构中是如何体现的。

LSTM结构

如图一所示为LSTM的结构,LSTM网络由一个个的LSTM单元连接而成。

image-20211025155036314

图一

图二描述了图一中各种元素的图标,从左到右分别为,神经网络LSTM详解)、向量元素操作LSTM详解表示向量元素乘,LSTM详解表示向量加),向量传输的方向向量连接向量复制

image-20211025155100987

图二

LSTM 的关键就是记忆单元,水平线在图上方贯穿运行。

记忆单元类似于传送带。直接在整个链上运行,只有一些少量的线性交互。信息在上面流传保持不变会很容易。

image-20211025161323857

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
社会演员多的头像社会演员多普通用户
上一篇 2023年2月25日 下午10:06
下一篇 2023年2月25日 下午10:08

相关推荐