OOTDiffusion:基于融合的潜在扩散技术的控制性虚拟试穿
本研究提出了一种改进的图像虚拟试穿的扩散模型(IDM-VTON),该模型通过使用高级语义和低级特征融合的方法,提高了服装的真实性,并生成了具有真实感的虚拟试穿图像。该研究还介绍了一种使用人物 - 服装图像对进行个性化定制的方法,并通过实验证明了该方法在保留服装细节和生成真实虚拟试穿图像方面的有效性。
Mar, 2024
通过在预训练扩散模型的潜在空间内学习衣物与人体之间的语义对应关系,利用零交叉关注区块保留衣物细节并利用预训练模型的内在知识进行图像变形处理,通过提出的新型注意力全变差损失和应用数据增强,实现了尖锐的注意力图,从而更准确地表示衣物细节。StableVITON 在定性和定量评估中胜过基准方法,在任意人物图像中展示了有希望的质量。
Dec, 2023
虽然虚拟试衣(VTON)基于潜在扩散模型的生成性能令人印象深刻,但缺乏对衣物关键细节(如风格、图案和文字)的忠实性。为了缓解由扩散随机性和潜在监督引起的这些问题,我们提出了一种新颖的面向 VTON 的忠实潜在扩散模型,称为 FLDM-VTON。FLDM-VTON 在三个主要方面改进了传统的潜在扩散过程。首先,我们提议将变形的衣物作为起点和局部条件,为模型提供忠实的衣物先验。其次,我们引入了一种新颖的衣物扁平化网络,以约束生成的试衣图像,提供一致的衣物忠实监督。第三,我们设计了一种具有忠实推理的衣物后验采样,进一步提高了模型在传统的衣物不可知高斯采样上的性能。对基准 VITON-HD 和 Dress Code 数据集的大量实验证明,我们的 FLDM-VTON 优于最先进的基线方法,并能够生成具有忠实衣物细节的照片级别的试衣图像。
Apr, 2024
LaDI-VTON 是应用于 Virtual Try-On 任务的第一款基于 Latent Diffusion textual Inversion 的模型,实验结果表明,该模型在保持纹理和细节方面比竞争对手表现更佳,并以显著的优势取得了里程碑式的成果。
May, 2023
通过引入新颖的信息感知和局部服装特征注意机制,WarpDiffusion 将基于变形和基于扩散的范式相结合,实现了高效和高保真度的虚拟试衣,从而提升了现有 VITON 方法的综合质量。
Dec, 2023
本研究讨论了当代电子商务和前景元宇宙中虚拟试穿的关键问题,强调在各种场景中保留目标人物和衣物的复杂纹理细节和独特特征所面临的挑战,并探索了现有方法的局限性和未解决的问题,随后提出了一种基于扩散的新颖解决方案,该解决方案在虚拟试穿过程中解决了服装纹理保留和用户身份保留的问题。该网络显示出令人印象深刻的结果,在推理过程中的速度超过最先进技术近 20 倍,并在定性评估中具有更高的保真度。在 VITON-HD 和 Dresscode 数据集上的定量评估证实了与最近的 SOTA 方法相当的性能。
Mar, 2024
本文提出 Outfit Visualization Net (OVNet) 方法以及其在多服装虚拟试穿成像方面的应用,该方法利用多项同步变形技术,通过语义布局生成器和逐层细化升级的图像生成管道生成高保真的多衣物虚拟试穿图片,并通过定制配件与人体协同识别的方法,能够将最适宜的配搭与体型匹配的用户展示在电子商务网站上,取得了极高的用户满意度。
Jun, 2021