Apr, 2024

通过无需训练的掩码引导扩散增强提示跟随的视觉控制

TL;DR本文提出了一种名为 Mask-guided Prompt Following (MGPF) 的无需训练的方法,通过引入物体掩码来区分对齐和未对齐的视觉控制和提示的部分,并设计了一个名为 Masked ControlNet 的网络,用于在未对齐的视觉控制区域生成对象。通过全面的定量和定性实验证明了 MGPF 的有效性和优越性。