Dec, 2023

GeNIe:通过扩散生成难负样本图像

TL;DR数据增强在训练深度模型中至关重要,防止其对有限数据过拟合。常见的数据增强方法虽然有效,但最近生成式人工智能的进展,如用于图像生成的扩散模型,使得更复杂的增强技术成为可能,能够生成类似于自然图像的数据。我们引入了 GeNIe,它利用一个以文本提示为条件的扩散模型,将对比的数据点(源类别的图像和目标类别的文本提示)合并起来生成对目标类别具有挑战性的样本。受到最近图像编辑方法的启发,我们限制扩散迭代次数和噪声量。这确保生成的图像保留源图像的低级和上下文特征,可能与目标类别产生冲突。我们的大量实验证明了我们的新型增强方法的有效性,尤其对于只有有限样本的类别有益。