ICLRMar, 2024

基于结构化状态空间的高效视频生成:SSM 遇见视频扩散模型

TL;DR基于扩散模型,我们提出利用状态空间模型进行视频生成,以解决注意力机制对内存的消耗随序列长度增加而呈二次增长的限制,并通过实验证明在更长的视频序列生成中,我们的基于状态空间模型的方法能够显著节省内存消耗同时保持与基于注意力模型竞争力的结果。