ConvLSTM原理解读

乘风 • 2023年7月28日下午8:50 • Python • 阅读 185

要理解ConvLSTM，首先要先来回顾一下LSTM的工作原理。

LSTM非常擅长处理时序信息也能处理空间信息。但对于三维图形来讲，因为有着丰富的空间信息并且每一个点和周围是有很强的相关性的，这就带来了冗余，传统的LSTM是很难刻画这种空间特征的。

由于 LSTM 在输入-隐状态、隐状态-输出的转换中使用了完全连接，因此也可以将其称为 Fully Connected-LSTM，FC-LSTM。

为了克服LSTM在处理三维信息中的不足，ConvLSTM 将 LSTM 中的2D的输入转换成了3D的tensor，最后两个维度是空间维度（行和列）。对于每一时刻t的数据，ConvLSTM 将 LSTM 中的一部分连接操作替换为了卷积操作，即通过当前输入和局部邻居的过去状态来进行预测。

LSTM 的表达如下所示：

ConvLSTM 将抽取空间特征的卷积操作加到了 LSTM 网络中，将 LSTM 中的一部分连接操作替换为了卷积操作。即：

其中， ConvLSTM原理解读表示卷积操作。

文章出处登录后可见！

已经登录？立即刷新