基于潜变扩散模型的长尾识别
这篇论文提出了一种新的长尾识别流程,通过利用长尾数据集本身生成一个平衡的代理,然后使用交叉熵进行优化。该方法使用了随机初始化的扩散模型,通过合成少数类别的新样本,并利用原始数据集中的关键信息过滤出有用的样本,而不需要任何外部数据或预训练模型权重,从而在 CIFAR10-LT、CIFAR100-LT 和 ImageNet-LT 等数据集上取得了领先竞争对手非常明显的最先进结果,同时具有丰富的解释性。
Mar, 2024
本文系统总结了深度长尾学习的最新进展,围绕着类别再平衡、信息增强和模块改进三个主要类别对相关方法进行详细探讨,并通过提出的相对准确度评估指标对最先进的方法进行了实证分析,为深度长尾学习的应用和未来研究方向提供了重要的参考。
Oct, 2021
本研究通过将长尾分布建模为不平衡领域,一般分布建模为平衡领域,提出了一种基于域适应的长尾识别解决机制。该机制通过松弛一般化误差界限、优化不平衡和平衡领域的经验风险、以及利用类内和类间距离来逼近域分歧,以可解释的方式将基于长尾分布的模型适应到一般分布中,实验结果验证了其在图像识别、物体检测和实例分割等方面达到了最先进的性能水平。
Oct, 2021
本文提出了一种新的解决长尾图像识别中头尾偏差问题的方法,通过调整标签空间来平衡数据,从而提高分类性能。实验证明该方法可应用于多种模型,并为长尾特征学习提供了思路。
Aug, 2022
本研究提出通过保留特定类别低频率的能力,并设计了一种有效的残差融合机制来缓解极不平衡数据分布的深度学习算法应用长尾数据分布时普遍存在的问题,通过在参数空间的角度来解决长尾识别问题,并在多个基准数据集上进行了测试,证明了方法的有效性。
Jan, 2021
本研究中,我们解耦学习过程,系统地探索不同平衡策略如何影响长尾识别的表示学习和分类器。我们的发现表明,数据不平衡在学习高质量表示方面可能不是问题,在使用最简单的实例平衡抽样进行学习表示的情况下,只需调整分类器就能实现强大的长尾识别能力,甚至可以胜过精心设计的损失、采样策略以及使用记忆组件的复杂模块。
Oct, 2019
本研究发现在使用类不平衡数据集训练扩散模型时,模型的多样性和保真度显著下降,提出了一种名为 “Class-Balancing Diffusion Models” 的方法来解决这个问题,并在 CIFAR100/CIFAR100LT 数据集上展现了出色的性能表现。
Apr, 2023
我们提出了一种结合潜在空间扩散模型和数据集精炼的潜在数据集精炼方法(LD3M),旨在解决机器学习面临的大型数据集和高分辨率图像生成的挑战,并在多个 ImageNet 子集和高分辨率图像上实验表明,LD3M 在 1 个和 10 个图像每类的情况下,相比最先进的精炼技术,提高了最高 4.8 个百分点和 4.2 个百分点的性能。
Mar, 2024
使用对比学习方法最小化不同类别合成图像分布之间的重叠,以改善长尾分布数据集中稀有类别的图像合成质量,并证明该方法能够有效处理基于扩散的生成和分类模型中的不平衡数据。
Feb, 2024