Feb, 2024

InstaGen: 通过合成数据集训练以增强目标检测

TL;DR通过在扩展类别或提高检测性能方面训练基于扩散模型生成的合成数据集,我们在本文中引入了一种新的范例来增强目标检测器的能力。具体而言,我们将实例级别的定位引导器集成到预训练的生成扩散模型中,使其具备定位生成图像中的任意实例的能力。该定位引导器通过使用一款现成的物体检测器的监督和一种针对检测器未涵盖的(新颖)类别的自我训练方案,将类别名称的文本嵌入与扩散模型的区域视觉特征对齐进行训练。这一增强版的扩散模型被称为 InstaGen,可用作目标检测的数据合成器。我们进行了详尽的实验,结果显示在从 InstaGen 的合成数据集上进行训练时,目标检测器可以得到增强,在开放词汇(+4.5 AP)和数据稀缺(+1.2 至 5.2 AP)的情景中表现出比现有最先进方法更好的性能。