Mar, 2023

文本可追溯视觉再现的新基准

TL;DR本研究构建了一种基于文本和视觉推理的控制生成图像的方法,其中通过新构建的 CLEVR-NOT 数据集和手动制作的 Fruit-NOT 数据集对模型的准确性和行为进行了详细分析,旨在提高文本图像生成模型的可控性和可解释性。