May, 2023

从一张图像中提取多个概念

TL;DR本文提出了一种文本场景分解任务,并介绍了一种基于掩模增强的输入方法和一个新颖的两阶段自定义过程,用于针对生成图像中的特定概念进行微调,并使用多种自动度量标准和用户研究,验证了该方法的有效性。