Apr, 2024

Diffusion-RWKV:为扩展扩散模型的 RWKV-Like 架构

TL;DR该论文介绍了一种在图像生成任务中应用于扩散模型的一系列基于 NLP 中 RWKV 模型的架构,通过针对性的修改,使其能在高分辨率图像生成任务中高效处理,减少计算复杂度。在条件和无条件图像生成任务上的实验结果表明,Diffusion-RWKV 在 FID 和 IS 指标上达到或超过现有的 CNN 或基于 Transformer 的扩散模型的性能,同时显著减少总计算 FLOP 使用。