CVPRApr, 2024

MULAN:用于可控文本到图像生成的多层注释数据集

TL;DR将一幅单眼 RGB 图像分解成为一个包含背景和独立实例的 RGBA 层叠,并重建遮挡区域,为高质量图像提供实例分解和遮挡信息的第一个照片逼真资源,为文本到图像生成 AI 研究开辟新的可能性。