May, 2024

MMTryon:多模式多参考高质量时尚生成控制

TL;DRMMTryon 是一个多模态多参考虚拟试衣 (VITON) 框架,通过输入文本指令和多个服装图像,可以生成高质量的组合试穿结果。它通过引入新颖的多模态和多参考注意机制来解决现有研究中忽略的多个试穿物品和定制穿着风格的问题,并使用无解析的服装编码器和新颖的可扩展数据生成流水线来消除对分割的依赖。实验证明了 MMTryon 在定性和定量方面相对于现有的技术的卓越表现,为时尚界探索多物品和可控风格虚拟试衣场景打开新的研究方向。