ICCVAug, 2023

SwinLSTM:使用 Swin Transformer 和 LSTM 提升时空预测准确性

TL;DR整合了 CNN 和 RNN 以捕捉时空相关性的方法被广泛应用于时空预测任务中。然而,CNN 学习局部空间信息的特性降低了其捕捉时空相关性的效率,从而限制了其预测准确性。本文中,我们提出了一种新的循环单元 SwinLSTM,它与 Swin Transformer 块和简化版的 LSTM 相结合,用自注意力机制替代了 ConvLSTM 中的卷积结构。此外,我们构建了一个以 SwinLSTM 单元为核心的网络用于时空预测。在 Moving MNIST、Human3.6m、TaxiBJ 和 KTH 数据集上,SwinLSTM 在没有使用特殊技巧的情况下,表现优于最先进的方法,特别在预测准确性方面展现了显著的提升。我们的竞争性实验结果证明了对模型捕捉时空相关性来说学习全局空间依赖性的优势,希望 SwinLSTM 能成为推动时空预测准确性进步的坚实基准。代码可在给定的 URL 中公开获取。