Nov, 2024

DiT4Edit:用于图像编辑的扩散变压器

TL;DR本研究解决了高分辨率图像中形状感知对象编辑方法的不足。提出的DiT4Edit是首个基于扩散变压器的图像编辑框架,通过使用DPM-Solver反演算法减少步骤,并设计了统一的注意力控制和补丁合并,显著提高了图像编辑的质量和速度。大量实验证明了DiT4Edit在各种编辑场景中的强大性能,展示了扩散变压器在图像编辑中的潜力。