Sep, 2024

基于姿态引导的人物图像合成的一次性学习

TL;DR本研究解决了现有姿态引导人物图像合成方法在野外样本中表现不佳的问题,尤其是在标签三元组数据稀缺的情况下。我们提出了一种名为OnePoseTrans的新方法,通过引入视觉一致性模块(VCM),结合面部、文本和图像嵌入,实现了在仅有单张源图像的情况下的高质量姿态迁移结果。研究表明,该方法在保持外观一致性方面具有显著优势,定制模型的速度可达48秒。