Feb, 2024
高效生成高分辨率图像的 Token 下采样策略
ToDo: Token Downsampling for Efficient Generation of High-Resolution Images
Ethan Smith, Nayan Saxena, Aninda Saha
TL;DR提出了一种密集注意力的训练无关方法以加速稳定扩散推理的进行,通过关键和值令牌的降采样,在常见尺寸和高分辨率下可以将推理速度提高 2 倍或更多,证明了该方法在平衡高效吞吐量和保真度方面优于之前的方法。