Apr, 2023

MS-LSTM: 探索视频预测领域的时空多尺度表示

TL;DR本文介绍了一种新的视频预测模型 ——MS-LSTM,该模型采用多尺度空间和时间结构,在充分捕捉时空上下文信息方面具有高效和优秀的性能。与现有的 RNN 模型不同的是,MS-LSTM 使用 LSTMs 和不同的卷积内核设计空间和时间尺度,实现多尺度表示,有效减少了训练成本,同时取得更好的表现。