基于语义感知的表示混合技术与部分标签的多标签图像识别

AAAIMar, 2022

基于语义感知的表示混合技术与部分标签的多标签图像识别

Semantic-Aware Representation Blending for Multi-Label Image Recognition with Partial Labels

Tao Pu, Tianshui Chen, Hefeng Wu, Liang Lin

TL;DR通过语义感知表示混合框架，将分类任务中已知数据中的信息迁移到未知数据中，进而提高多标签图像识别的性能。

Abstract

Training the multi-label image recognition models with partial labels, in which merely some labels are known while others are unknown for each image, is a considerably challenging and practical task. To address t

multi-label image recognition partial labels semantic-aware representation blending ilrb module plrb module

发现论文，激发创造

使用部分标签进行多标签识别的结构化语义转移

提出了一种结构化的语义转移（SST）框架，用于训练多标签识别模型，其特点是仅知道某些标签而丢失了其他标签。该框架包括两个互补的转移模块，探索图像内部和跨图像的语义相关性，以生成未知标签的伪标签，并使用已知和生成的标签来训练多标签识别模型。实验表明，该框架在多个数据集上实现了优越的性能。

Dec, 2021

学习语义特定图表示用于多标签图像识别

提出了一种 Semantic-Specific Graph Representation Learning (SSGRL) 的框架，包含两个重要模块：语义解耦模块和语义交互模块，其中语义解耦模块结合类别语义以指导学习语义特定表示，语义交互模块则将这些表示与基于统计标签共现构建的图相互关联，可以通过图传播机制来探索它们的相互作用，通过大量的公共基准测试，证明 SSGRL 框架优于现有的最新方法。

Aug, 2019

多标签图像分类的语义感知双对比学习

通过引入样本对间对比学习和原型 - 样本对比学习，提出了一种新颖的语义感知双对比学习框架，通过联合训练三个模块，准确捕捉与图像内容相关的判别性标签级特征，并在五个具有挑战性的大规模公共数据集上实验证明了该方法的有效性优于现有技术。

Jul, 2023

多标签图像识别的语义感知图匹配机制

本文提出了一种基于 Semantic-aware Graph Matching 的多标签图像识别框架（ML-SGM），通过建模内容感知（instance）和语义感知（label）之间的关系，显式建立分类之间的相关性和实例 - 标签对应关系，以促进多标签图像理解，并减少对每个类别的大量训练样本的依赖。备考外流考试，了解更多。

Apr, 2023

基于超像素低秩逼近的部分标签学习用于高光谱图像分类

本文提出了一种新的基于超像素低秩逼近（LRA）的部分标签学习方法 SLAP，该方法在高光谱图像（HSI）分类中首次考虑到部分标签学习，并且通过实验验证了该方法相对于现有方法的优势。

May, 2024

主动半监督表示学习的语义分割

本文提出一种新算法，将半监督和主动学习相结合，通过用少量的有标签数据来训练分割算法。我们通过用自我训练方法替换半监督学习的平均教师方法，以处理带有噪声的标签，进一步增强神经网络的能力来查询有用的数据，从而实现了超越现有半监督方法的性能。在 CamVid 和 CityScapes 数据集上评估我们的方法，仅使用了 12.1% 和 15.1% 的标签数据，分别实现了 95% 以上的准确率。

Oct, 2022

PRCL: 半监督语义分割的概率表示对比学习

通过对半监督语义分割进行对比学习取得了巨大突破，但是由于有限的注释，模型自身生成的无标签图像上的引导 inevitably 存在噪音，扰乱了无监督训练过程。为了解决这个问题，我们提出了一个强大的基于对比的 S4 框架，称为概率表示对比学习 (PRCL) 框架来增强无监督训练过程的鲁棒性。我们将逐像素表示建模为多元高斯分布的概率表示 (PR), 并通过调整模糊表示的贡献度来容忍对比学习中的不准确引导的风险。此外，我们通过收集整个训练过程中所有 PR 生成全局分布原型 (GDP)。由于 GDP 包含相同类别的所有表示的信息，它在表示中即使存在噪声也是鲁棒的，并且承载着表示的类内差异。此外，我们基于 GDP 生成虚拟负样本 (VNs) 来参与对比学习过程。在两个公开基准测试上进行的大量实验证明了我们 PRCL 框架的优越性。

Feb, 2024

简化的平均与稳健的基于嘈杂部分标签的识别

SARI is a minimalistic framework for noisy partial label learning that combines average-based and identification-based strategies, achieving state-of-the-art results in fine-grained classification and extreme noise settings.

Feb, 2024

多分类标签查询的语义分割主动学习

该论文提出了一种新的语义分割主动学习方法，通过新的注释查询设计获取信息丰富的局部图像区域，使用多类别标注策略进行训练，解决了类别不确定性问题，最终在 Cityscapes 和 PASCAL VOC 2012 数据集上取得了优越的性能并降低了注释成本。

Sep, 2023

单正多标签识别语义对比自举

本研究提出了一种基于语义对比引导的递归语义掩蔽转换器和引导框架，用于解决多标签图像识别中单一正标签的困难问题，通过迭代优化网络参数和细化语义指导，显著提高了多标签图像识别的性能。

Jul, 2023