Nov, 2024

PoM:使用多项式混合器的高效图像和视频生成

TL;DR本研究解决了基于多头注意力(MHA)的扩散模型在图像和视频生成中的高内存和计算需求问题。我们提出了一个名为多项式混合器(PoM)的替代方案,其具有线性复杂性,并能以显式状态编码整个序列,显著降低资源消耗。我们的实验表明,PoM在生成高质量样本方面有效,同时降低了计算资源的需求。