BriefGPT.xyz
Nov, 2024
PoM:使用多项式混合器的高效图像和视频生成
PoM: Efficient Image and Video Generation with the Polynomial Mixer
HTML
PDF
David Picard, Nicolas Dufour
TL;DR
本研究解决了基于多头注意力(MHA)的扩散模型在图像和视频生成中的高内存和计算需求问题。我们提出了一个名为多项式混合器(PoM)的替代方案,其具有线性复杂性,并能以显式状态编码整个序列,显著降低资源消耗。我们的实验表明,PoM在生成高质量样本方面有效,同时降低了计算资源的需求。
Abstract
Diffusion Models
based on
Multi-Head Attention
(MHA) have become ubiquitous to generate high quality images and videos. However, encoding an image or a video as a sequence of patches results in costly attention p
→