Aug, 2024

双仿射变换生成对抗网络用于文本引导的图像修复

TL;DR本研究解决了文本引导图像修复中图像与文本之间对齐以及破损区域与未破损区域分布一致性的问题。提出的双仿射变换生成对抗网络(DAFT-GAN)通过逐步结合文本和图像特征,保持语义一致性,并通过分别编码破损和未破损区域来最小化信息泄露。该模型在MS-COCO、CUB和Oxford三套基准数据集上,在定性和定量评估中优于现有的基于GAN的模型。