通过特征空间增强和迭代学习实现长尾图像生成
通过基于隐式扩散模型的特征增强方法,本研究解决计算机视觉中的长尾不平衡分布问题,并在 CIFAR-LT 和 ImageNet-LT 数据集上验证了模型的准确性提升。
Apr, 2024
本文提出了一种新方法,通过在特征空间中使用来自具有丰富样本的类别所学习的特征来增强特征空间中的欠表示类别,从而解决长尾分布问题。通过使用类别激活映射,将每个类别的特征分解为类别通用和类别特定部分,并将欠表示类别的类别特定特征与混淆类别的类别通用特征融合,实时生成新样本。结果表明,在 iNaturalist、ImageNet-LT、Places-LT 以及 CIFAR 的长尾版本等数据集上,本文所提出的方法展现了最先进的表现水平。
Aug, 2020
本文研究如何学习 deep learning 中的 feature 并解决长尾数据集中头尾类别分布错位、影响特征判别能力的问题。我们提出了使用‘特征云’方法来恢复长尾数据集的‘类内多样性’,并在 person re-identification 和 face recognition 任务中进行实验验证。
Feb, 2020
本研究介绍了一种基于文本的图像编辑方法,利用最新的扩散模型对一些基于文本主题的地方图像进行编辑,通过结合扩散模型的速度和 Blended Diffusion,提高了编辑的效率,并通过优化方法来解决扩散模型无法完美重建图像的问题,实现了比当前方法更高的精度和速度
Jun, 2022
本文介绍了一种名为 “Diffusion Inversion” 的方法,该方法使用预先训练的生成模型 Stable Diffusion,通过将图像倒换到其潜在空间中来捕获原始数据分布并确保数据覆盖,即可生成多样高质量的训练图片,此方法通过三个关键部件成功替换了原始数据集,从而提高了样本复杂度并缩短了采样时间,不仅优于泛化提示导向方法和 KNN 检索基线,还可与常见数据增强技术兼容,提高少样本学习的可靠性。
May, 2023
通过在大规模无标签数据集上预训练潜在扩散模型(LDM),我们提出了一种名为 HistoDiffusion 的合成增强方法,然后在未见过的有标签数据集上通过分类器引导在潜在空间中微调模型,以合成特定类别的图像,并采用选择性机制只添加与目标标签匹配度较高的合成样本,通过 HistoDiffusion 增强,使用少量原始标签,我们大幅提高了骨干分类器的分类准确率 6.4%。
Aug, 2023
使用对比学习方法最小化不同类别合成图像分布之间的重叠,以改善长尾分布数据集中稀有类别的图像合成质量,并证明该方法能够有效处理基于扩散的生成和分类模型中的不平衡数据。
Feb, 2024
这篇论文提出了一种新的长尾识别流程,通过利用长尾数据集本身生成一个平衡的代理,然后使用交叉熵进行优化。该方法使用了随机初始化的扩散模型,通过合成少数类别的新样本,并利用原始数据集中的关键信息过滤出有用的样本,而不需要任何外部数据或预训练模型权重,从而在 CIFAR10-LT、CIFAR100-LT 和 ImageNet-LT 等数据集上取得了领先竞争对手非常明显的最先进结果,同时具有丰富的解释性。
Mar, 2024
利用切片扩散架构,从医学图像生成融合体数据和对应掩膜,以解决医学图像分割中数据获取不足的问题,并考虑肿瘤特征进行生成,通过对 BRATS2022 数据集的实验证明生成数据对数据增强的有效性。
Jun, 2024