Dec, 2023

多元化训练,不是微调:使用合成图像扩大视觉识别训练规模

TL;DR通过在大型语言模型和 CLIP 的辅助下,使用生成模型生成合成训练图像来解决类名的歧义性、缺乏多样性的问题,并利用域适应技术和辅助批归一化来减轻领域偏移,以更好地提升模型识别性能。