Feb, 2024

MIGC: 文本到图像合成的多实例生成控制器

TL;DR我们提出了一个多实例生成任务(MIG),在一幅图像中同时生成具有多样控制的多个实例。通过将MIG任务分解为若干子任务,并引入创新方法MIGC,利用实例增强的注意力机制精确阴影每个实例并聚合它们来生成多个整合属性和位置的实例。在COCO-MIG基准上进行了广泛实验,评估结果显示了我们模型在数量、位置、属性和交互方面的优异控制能力。