Jun, 2024

SwinStyleformer 是图像反转的理想选择

TL;DRSwinStyleformer 是首个纯 Transformer 结构反演网络,通过处理长程依赖和学习对象的全局结构来弥补 CNN 反演框架的不足。我们将 Swin Transformer 作为 SwinStyleformer 的骨干,并设计了基于可学习查询的 Transformer 块、多尺度连接以及反演鉴别器和分布对齐损失,从而成功解决了 Transformer 的反演失败问题,并在图像反演和相关视觉任务中展示了 SOTA 性能。