Oct, 2022
卷积模型为什么在长序列建模上表现出色?
What Makes Convolutional Models Great on Long Sequence Modeling?
Yuhong Li, Tianle Cai, Yi Zhang, Deming Chen, Debadeepta Dey
TL;DR本文讨论了卷积模型的长程依赖问题,并介绍了一种名为 S4 的模型及其相应的结构基本原理,以及基于这些原理提出的 SGConv 卷积模型,在多项任务上表现出了强大的实际性能和潜力。