MetaSAug: 面向长尾视觉识别的元语义增强
该论文提出了一种新颖的隐式语义数据增强(ISDA)方法,通过在线估计每个类别的深度特征协方差矩阵并在特征空间中沿着许多语义方向平移训练样本来有效增强数据集以提高泛化性能,并提出了一个新颖的鲁棒 CE 损失函数,实现了在多个数据集上对 ResNets 和 DenseNets 等流行的深度模型的一致性提高的效果。
Sep, 2019
本文提出了一种新颖的基于推理的隐性语义数据增广方法来缓解长尾分布数据分类算法性能下降的问题,并通过构建协方差矩阵和知识图谱,从相似类别中采样新方向来生成新的样本实例,从而适应性增强长尾数据,实验证明该方法有效。
Dec, 2021
本研究针对图像分类器的训练方法进行了探讨,通过元学习算法对支持数据、查询数据和任务进行复杂的抽样,利用数据增强方法不仅可增加每个类别的图片数量,还可生成全新的类别和任务,提高了元学习器在少样本分类基准上的性能。
Oct, 2020
通过语义感知数据增强 (SADA) 框架来提升文本到图像合成 (T2Isyn) 模型中的文本 - 图像一致性并改善图像质量。该框架通过隐式文本语义保持增强 (ITA) 在语义空间中扩充文本,并结合特定设计的图像语义正则化损失 (Lr) 作为生成图像的语义保持,以解决语义不匹配和坍塌问题。大量实验证实了 SADA 在各种模型中提升了文本 - 图像一致性和图像质量,特别是在 Stable Diffusion 模型调整过程中的改进效果。
Dec, 2023
本文提出了一种新方法,通过在特征空间中使用来自具有丰富样本的类别所学习的特征来增强特征空间中的欠表示类别,从而解决长尾分布问题。通过使用类别激活映射,将每个类别的特征分解为类别通用和类别特定部分,并将欠表示类别的类别特定特征与混淆类别的类别通用特征融合,实时生成新样本。结果表明,在 iNaturalist、ImageNet-LT、Places-LT 以及 CIFAR 的长尾版本等数据集上,本文所提出的方法展现了最先进的表现水平。
Aug, 2020
本研究探讨了在小数据情况下的长尾识别问题,提出了一种以自然场景解析数据集 ADE20K 为基础的模型增强方法,并划分不同分布的头尾目标类别进行表示学习和评估,其中进一步围绕 “稀有类别” 和 “训练图像匮乏” 构建了两个新的研究方向,实验表明通过密集标注少量图像即可在一定程度上缓解小数据约束。
Nov, 2019
本文介绍了一种新的领域自适应方法,即 Transferable Semantic Augmentation (TSA),该方法通过隐式地生成目标语义,提高分类器适应能力,来改进现有领域适应算法中的特征表示问题。具体方法是使用多元正态分布来进行源特征的数据增强,该方法可轻松接入各种领域适应方法,取得了显著的改进效果。
Mar, 2021
提出了一种名为 Bayesian Random Semantic Data Augmentation 的新型、高效且即插即用的语义数据增强方法(BRSDA),通过在特征空间中沿特定方向进行简单的平移,实现语义转换,并结合其他主流的数据增强方法,取得了优越的性能。
Mar, 2024
该论文提出了一种新的数据增强模型 Continuous Semantic Augmentation (CsaNMT), 该模型可以使神经机器翻译模型在低资源环境中表现出更好的泛化性能和更高的翻译质量。通过丰富训练数据,提高了机器翻译的性能,并在多个语言翻译任务中取得了大幅度的提升。
Apr, 2022