通过特征空间增强和迭代学习实现长尾图像生成

May, 2024

通过特征空间增强和迭代学习实现长尾图像生成

Long Tail Image Generation Through Feature Space Augmentation and Iterated Learning

Rafael Elberg, Denis Parra, Mircea Petrache

TL;DR基于稀疏嵌入和 K-NN 方法，我们提出了一种基于预训练的稳定扩散模型的图像增强方法，以解决图像生成中的数据不平衡问题。

Abstract

Image and multimodal machine learning tasks are very challenging to solve in the case of poorly distributed data. In particular, data availability and privacy restrictions exacerbate these hurdles in the medical domain. The state of the art in →

image generation multimodal machine learning latent diffusion models long-tailed data image augmentation

发现论文，激发创造

基于潜变扩散模型的长尾识别

通过基于隐式扩散模型的特征增强方法，本研究解决计算机视觉中的长尾不平衡分布问题，并在 CIFAR-LT 和 ImageNet-LT 数据集上验证了模型的准确性提升。

Apr, 2024

长尾数据的特征空间增强

本文提出了一种新方法，通过在特征空间中使用来自具有丰富样本的类别所学习的特征来增强特征空间中的欠表示类别，从而解决长尾分布问题。通过使用类别激活映射，将每个类别的特征分解为类别通用和类别特定部分，并将欠表示类别的类别特定特征与混淆类别的类别通用特征融合，实时生成新样本。结果表明，在 iNaturalist、ImageNet-LT、Places-LT 以及 CIFAR 的长尾版本等数据集上，本文所提出的方法展现了最先进的表现水平。

Aug, 2020

长尾数据上的深度表示学习：一种可学习的嵌入增强视角

本文研究如何学习 deep learning 中的 feature 并解决长尾数据集中头尾类别分布错位、影响特征判别能力的问题。我们提出了使用‘特征云’方法来恢复长尾数据集的‘类内多样性’，并在 person re-identification 和 face recognition 任务中进行实验验证。

Feb, 2020

混合潜在扩散

本研究介绍了一种基于文本的图像编辑方法，利用最新的扩散模型对一些基于文本主题的地方图像进行编辑，通过结合扩散模型的速度和 Blended Diffusion，提高了编辑的效率，并通过优化方法来解决扩散模型无法完美重建图像的问题，实现了比当前方法更高的精度和速度

Jun, 2022

利用潜在引导扩散和嵌套集合提高医学图像分类的鲁棒性和可靠性

通过转换器与条件扩散模型相结合的新方法，提高了深度学习模型在医学图像分析中对图像的稳健性，并增加了对临床实践的信任度。

Oct, 2023

在空中训练：使用生成数据提高图像分类

本文介绍了一种名为 “Diffusion Inversion” 的方法，该方法使用预先训练的生成模型 Stable Diffusion，通过将图像倒换到其潜在空间中来捕获原始数据分布并确保数据覆盖，即可生成多样高质量的训练图片，此方法通过三个关键部件成功替换了原始数据集，从而提高了样本复杂度并缩短了采样时间，不仅优于泛化提示导向方法和 KNN 检索基线，还可与常见数据增强技术兼容，提高少样本学习的可靠性。

May, 2023

大规模无条件预训练的合成增强

通过在大规模无标签数据集上预训练潜在扩散模型（LDM），我们提出了一种名为 HistoDiffusion 的合成增强方法，然后在未见过的有标签数据集上通过分类器引导在潜在空间中微调模型，以合成特定类别的图像，并采用选择性机制只添加与目标标签匹配度较高的合成样本，通过 HistoDiffusion 增强，使用少量原始标签，我们大幅提高了骨干分类器的分类准确率 6.4%。

Aug, 2023

通过重叠优化训练类不平衡的扩散模型

使用对比学习方法最小化不同类别合成图像分布之间的重叠，以改善长尾分布数据集中稀有类别的图像合成质量，并证明该方法能够有效处理基于扩散的生成和分类模型中的不平衡数据。

Feb, 2024

DiffuLT: 如何使扩散模型对于长尾识别变得有益

这篇论文提出了一种新的长尾识别流程，通过利用长尾数据集本身生成一个平衡的代理，然后使用交叉熵进行优化。该方法使用了随机初始化的扩散模型，通过合成少数类别的新样本，并利用原始数据集中的关键信息过滤出有用的样本，而不需要任何外部数据或预训练模型权重，从而在 CIFAR10-LT、CIFAR100-LT 和 ImageNet-LT 等数据集上取得了领先竞争对手非常明显的最先进结果，同时具有丰富的解释性。

Mar, 2024

基于切片隐式扩散模型的 3D MRI 合成：改善数据稀缺情况下肿瘤分割任务

利用切片扩散架构，从医学图像生成融合体数据和对应掩膜，以解决医学图像分割中数据获取不足的问题，并考虑肿瘤特征进行生成，通过对 BRATS2022 数据集的实验证明生成数据对数据增强的有效性。

Jun, 2024