Jun, 2024

基于生成数据集的正则化训练:仅包含名称的视觉-语言模型转化

TL;DR通过对生成图像进行微调,本文研究目的是解决在生成的数据集上微调以特定分类模型的视觉-语言模型时所面临的挑战,并提供两种正则化方法来克服实际图像与生成图像之间的领域差异。经过广泛的实验验证,所提出的分析和正则化技术有效减轻了一直被忽视的领域差异,并使得在生成图像上的训练达到了最先进的性能。