Nov, 2023

Lego:在文本到图像扩散模型中学习解耦和反转概念

TL;DR该研究介绍了一种名为 Lego 的文本反演方法,用于从少量示例图像中反演与主体相关的概念。Lego 通过简单而有效的主体分离步骤以及引导单 / 多嵌入概念反演的上下文损失,成功实现了对这些概念的反演。在深入的用户研究中,与基准方法相比,Lego 生成的概念有超过 70% 的受试者更喜欢。此外,使用大型语言模型进行视觉问题回答的结果表明,Lego 生成的概念与文本描述更加一致。