Nov, 2024
通过领域适应控制文本到图像扩散模型中的人类形状和姿势
Controlling Human Shape and Pose in Text-to-Image Diffusion Models via
Domain Adaptation
TL;DR本研究解决了在预训练文本到图像扩散模型中对人类形状和姿势进行有条件控制的挑战。我们提出了一种领域适应技术,通过在分类器自由引导向量中隔离合成训练的条件信息,并与另一个控制网络组合,以适应生成图像输入领域。实验结果表明,该模型在形状和姿势多样性方面优于传统方法,同时保持了视觉保真度,具有重要的下游应用潜力,如人类动画。