基于语义感知的表示混合技术与部分标签的多标签图像识别
提出了一种结构化的语义转移(SST)框架,用于训练多标签识别模型,其特点是仅知道某些标签而丢失了其他标签。该框架包括两个互补的转移模块,探索图像内部和跨图像的语义相关性,以生成未知标签的伪标签,并使用已知和生成的标签来训练多标签识别模型。实验表明,该框架在多个数据集上实现了优越的性能。
Dec, 2021
提出了一种 Semantic-Specific Graph Representation Learning (SSGRL) 的框架,包含两个重要模块:语义解耦模块和语义交互模块,其中语义解耦模块结合类别语义以指导学习语义特定表示,语义交互模块则将这些表示与基于统计标签共现构建的图相互关联,可以通过图传播机制来探索它们的相互作用,通过大量的公共基准测试,证明 SSGRL 框架优于现有的最新方法。
Aug, 2019
通过引入样本对间对比学习和原型 - 样本对比学习,提出了一种新颖的语义感知双对比学习框架,通过联合训练三个模块,准确捕捉与图像内容相关的判别性标签级特征,并在五个具有挑战性的大规模公共数据集上实验证明了该方法的有效性优于现有技术。
Jul, 2023
本文提出了一种基于 Semantic-aware Graph Matching 的多标签图像识别框架(ML-SGM),通过建模内容感知(instance)和语义感知(label)之间的关系,显式建立分类之间的相关性和实例 - 标签对应关系,以促进多标签图像理解,并减少对每个类别的大量训练样本的依赖。备考外流考试,了解更多。
Apr, 2023
本文提出了一种新的基于超像素低秩逼近(LRA)的部分标签学习方法 SLAP,该方法在高光谱图像(HSI)分类中首次考虑到部分标签学习,并且通过实验验证了该方法相对于现有方法的优势。
May, 2024
本文提出一种新算法,将半监督和主动学习相结合,通过用少量的有标签数据来训练分割算法。我们通过用自我训练方法替换半监督学习的平均教师方法,以处理带有噪声的标签,进一步增强神经网络的能力来查询有用的数据,从而实现了超越现有半监督方法的性能。在 CamVid 和 CityScapes 数据集上评估我们的方法,仅使用了 12.1% 和 15.1% 的标签数据,分别实现了 95% 以上的准确率。
Oct, 2022
通过对半监督语义分割进行对比学习取得了巨大突破,但是由于有限的注释,模型自身生成的无标签图像上的引导 inevitably 存在噪音,扰乱了无监督训练过程。为了解决这个问题,我们提出了一个强大的基于对比的 S4 框架,称为概率表示对比学习 (PRCL) 框架来增强无监督训练过程的鲁棒性。我们将逐像素表示建模为多元高斯分布的概率表示 (PR), 并通过调整模糊表示的贡献度来容忍对比学习中的不准确引导的风险。此外,我们通过收集整个训练过程中所有 PR 生成全局分布原型 (GDP)。由于 GDP 包含相同类别的所有表示的信息,它在表示中即使存在噪声也是鲁棒的,并且承载着表示的类内差异。此外,我们基于 GDP 生成虚拟负样本 (VNs) 来参与对比学习过程。在两个公开基准测试上进行的大量实验证明了我们 PRCL 框架的优越性。
Feb, 2024
SARI is a minimalistic framework for noisy partial label learning that combines average-based and identification-based strategies, achieving state-of-the-art results in fine-grained classification and extreme noise settings.
Feb, 2024
该论文提出了一种新的语义分割主动学习方法,通过新的注释查询设计获取信息丰富的局部图像区域,使用多类别标注策略进行训练,解决了类别不确定性问题,最终在 Cityscapes 和 PASCAL VOC 2012 数据集上取得了优越的性能并降低了注释成本。
Sep, 2023
本研究提出了一种基于语义对比引导的递归语义掩蔽转换器和引导框架,用于解决多标签图像识别中单一正标签的困难问题,通过迭代优化网络参数和细化语义指导,显著提高了多标签图像识别的性能。
Jul, 2023