长尾实例分割的生成式主动学习

ICMLJun, 2024

Generative Active Learning for Long-tailed Instance Segmentation

Muzhi Zhu, Chengxiang Fan, Hao Chen, Yang Liu, Weian Mao...

TL;DR本文探讨了如何在长尾实例分割任务中专门对生成数据执行主动学习，并提出了一种新的基于梯度缓存的算法 BSGAL，可以有效处理无限的生成数据和复杂的下游分割任务。实验证明，BSGAL 优于基线方法，有效提高了长尾分割的性能。

Abstract

Recently, large-scale language-image generative models have gained widespread attention and many works have utilized generated data from these models to further enhance the performance of →

large-scale language-image generative models perception tasks generated data active learning long-tailed instance segmentation

发现论文，激发创造

使用样本选择和条件生成对抗网络的图像分类和分割高效主动学习

使用生成对抗网络和贝叶斯神经网络的主动学习框架，可以从少量的医学图像中训练出具有良好鲁棒性的深度学习系统，取得了同类方法中最先进的性能表现。

Jun, 2018

图像合成个性化的生成式主动学习

该研究提出了一项旨在将传统上应用于判别模型背景下的主动学习方法应用于生成模型的试点研究，重点关注图像合成个性化任务。通过引入锚定方向的概念，将查询过程转化为半开放问题，并提出了一种基于方向的不确定性采样策略来实现生成式主动学习并解决开发 - 探索的问题。通过大量实验验证了我们方法的有效性，表明开源模型在性能上可以比大公司开发的封闭模型（如 Google 的 StyleDrop）取得更好的结果。

Mar, 2024

贝叶斯生成主动深度学习

本文提出一种贝叶斯生成主动深度学习方法，将主动学习与数据增强相结合，通过在 MNIST、CIFAR-10/100 和 SVHN 数据集上进行训练和分类实验证明，此方法具有更高效的训练和更好的分类结果。

Apr, 2019

Fill-Up: 用生成模型平衡长尾数据

该研究提出了一种新的基于 Textual Inversion 的图像合成流程，利用生成的图像填充 real-world 数据不平衡情况，该方法在长尾识别方面取得了最先进的结果。

Jun, 2023

图像分类的主动生成

该论文提出了一种名为 ActGen 的方法，旨在提高图像生成的效率，并通过将生成的图像纳入训练集来增强模型性能。通过使用真实图像作为引导，在扩散模型的去噪过程中，引入了一种注重图像引导的技术，并利用模型对类别提示的关注来确保类似前景对象的保留性，同时增加背景的多样性。此外，还引入了一种基于梯度的生成引导方法，用两种损失生成更具挑战性的样本，并防止生成的图像与之前生成的图像过于相似。在 CIFAR 和 ImageNet 数据集上进行的实验结果表明，该方法在产生的图像数量显著减少的同时，实现了更好的性能。

Mar, 2024

用于图像分类的主动生成对抗网络

本研究提出了一种结合有监督的条件生成对抗网络和主动学习的新模型，以更小的代价获得数据的标记，且生成的样本能有效地提高流行的图像分类任务中的分类性能。

Jun, 2019

LTGC：借助 LLMs 驱动的生成内容进行长尾识别

本文提出了一种新的生成和微调框架，LTGC（Long-Tail Generative and Fine-Tuning Framework），通过利用生成的内容来处理长尾识别问题。该框架通过利用大规模模型中丰富的隐式知识来解析和推理原始尾部数据，生成多样的尾部类别内容，并通过几种新颖的设计确保生成数据的质量，以及利用生成和原始数据进行高效微调。可视化结果证明了 LTGC 中生成模块的有效性，它能产生准确且多样的尾部数据，实验结果表明我们的 LTGC 在流行的长尾基准测试中优于现有的最先进方法。

Mar, 2024

通过群谱正则化改进长尾数据的 GAN

本文旨在探讨如何解决长尾分布下的影像生成问题，在对类别分布不均衡的尾部类别生成图像时，提出了一种基于条件生成对抗网络和组谱正则化（gSR）的解决方法，并得到了实验验证。

Aug, 2022

LLMGA: 基于多模态大型语言模型的生成助手

该研究介绍了一种基于多模态大型语言模型的生成助手（LLMGA），利用大型语言模型（LLM）中内在的知识和理解能力，帮助用户进行图像生成和编辑，通过精确控制生成提示实现对稳定扩散（SD）的控制，以提供更精细、准确的内容和更直观的网络解释性，同时还提出了一个两阶段的训练方案来优化 SD 的生成结果，并引入基于参考的恢复网络来减少图像编辑过程中生成区域与保留区域之间的纹理、亮度和对比度差异。广泛的实验结果表明，LLMGA 具有很好的生成能力，并能以交互方式在更广泛的应用中发挥作用。

Nov, 2023

CoMaL: 条件极大似然方法实现在长尾语义分割的自监督领域适应

本研究提出了一种新的自监督域适应方法来解决长尾语义分割问题，并在 “SYNTHIA 到 Cityscapes” 和 “GTA 到 Cityscapes” 等流行的大规模语义分割基准测试中表现出比之前方法更好的性能。

Apr, 2023