Nov, 2024
带有难度控制的扩散模型进行训练数据合成
Training Data Synthesis with Difficulty Controlled Diffusion Model
TL;DR本研究针对半监督学习中未标记数据被合成图像污染的问题,通过提出真实-合成混合半监督学习(RS-SSL)任务,探讨合成图像对半监督学习的影响。同时,提出RSMatch这一新方法,能有效识别和利用未标记的合成数据,将其从“障碍”转变为“资源”。研究结果表明,RSMatch显著提升了SSL模型的性能。