Apr, 2024
FLDM-VTON:用于虚拟试衣的忠实潜在扩散模型
FLDM-VTON: Faithful Latent Diffusion Model for Virtual Try-on
TL;DR虽然虚拟试衣(VTON)基于潜在扩散模型的生成性能令人印象深刻,但缺乏对衣物关键细节(如风格、图案和文字)的忠实性。为了缓解由扩散随机性和潜在监督引起的这些问题,我们提出了一种新颖的面向VTON的忠实潜在扩散模型,称为FLDM-VTON。FLDM-VTON在三个主要方面改进了传统的潜在扩散过程。首先,我们提议将变形的衣物作为起点和局部条件,为模型提供忠实的衣物先验。其次,我们引入了一种新颖的衣物扁平化网络,以约束生成的试衣图像,提供一致的衣物忠实监督。第三,我们设计了一种具有忠实推理的衣物后验采样,进一步提高了模型在传统的衣物不可知高斯采样上的性能。对基准VITON-HD和Dress Code数据集的大量实验证明,我们的FLDM-VTON优于最先进的基线方法,并能够生成具有忠实衣物细节的照片级别的试衣图像。