May, 2023

TD-GEM: 文本驱动的服装编辑映射器

TL;DR本文提出了一种名为 TD-GEM 的文本驱动服装编辑方案方法,通过生成对抗网络反演获取数据图像的潜在表达,之后通过对比学习的语言图像预训练(CLIP)指导一个服装图像的潜在表达,以在保持图像其他部分不变的情况下编辑与文本要求一致的服装项目,该方案通过对颜色和袖长进行实验,生成了更逼真的图像。