Jun, 2024
合成训练图像的未实现承诺:使用检索的真实图像性能更好
The Unmet Promise of Synthetic Training Images: Using Retrieved Real Images Performs Better
Scott Geng, Cheng-Yu Hsieh, Vivek Ramanujan, Matthew Wallingford, Chun-Liang Li...
TL;DR通过对比采用生成模型生成的人工数据和来自真实数据的有针对性图像进行微调,在任务上针对性生成的合成数据被真实数据普遍匹配或超越,这表明合成图像中存在生成器伪像和不准确的任务相关视觉细节。总体而言,我们认为在使用合成数据进行训练时,检索是一个必须考虑的关键基线。