May, 2024

ODGEN: 使用扩散模型进行领域特定目标检测数据生成

TL;DRODGEN 是一种新的条件高质量图像生成方法,用于生成复杂场景中多类对象和具有遮挡的密集对象,进而促进目标检测数据的合成。通过在裁剪的前景对象和整个图像上对预训练的扩散模型进行微调,再借助合成的视觉提示和对象描述来控制扩散模型,ODGEN 在处理复杂场景和特定领域方面表现出了鲁棒性,并通过数据集合成管道在 7 个特定领域的基准测试中进行了评估以展示其有效性,与 YOLOv5 和 YOLOv7 等对象检测器相比,添加 ODGEN 生成的训练数据可以将 [email protected]:.95 改善高达 25.3%,而且在基于 COCO-2014 的评估协议下,ODGEN 在一般领域中的 [email protected]:.95 优势高达 5.6%。