CNN-RNN：一种多标签图像分类的统一框架

Apr, 2016

CNN-RNN：一种多标签图像分类的统一框架

CNN-RNN: A Unified Framework for Multi-label Image Classification

Jiang Wang, Yi Yang, Junhua Mao, Zhiheng Huang, Chang Huang...

TL;DR本文提出了一种基于卷积神经网络和循环神经网络的框架，用于多标签图像分类，通过学习图像标签嵌入特征，显式地利用了图像标签之间的关联性，拥有较好的分类性能。

Abstract

While deep convolutional neural networks (CNNs) have shown a great success in single-label image classification, it is important to note that real world images generally contain multiple labels, which could correspond to different objects, scenes, actions and attributes in an image. Tr

发现论文，激发创造

CNN: 单标签到多标签

本研究提出了一个深度卷积神经网络结构(HCP)，可灵活应对多标签图像任务，并成功应用于Pascal VOC2007和VOC2012数据集中，表现优于其他同类算法，最大平均精度达到84.2%。

Jun, 2014

循环图片注释的语义正则化

本文研究为了改进多标签分类与图像标注任务中CNN-RNN设计模式，在CNN与RNN之间引入一个有着语义规范化的嵌入层，以分离学习任务并使得训练更加高效。实验证明，该模式取得了多标签分类与图像标注任务的最新成果。

Nov, 2016

基于区域潜在语义相关性的多标签图像分类

本论文提出了一种区域潜在语义依赖模型，该模型使用卷积神经网络和递归神经网络相结合，能够有效预测多标签图像分类中小物体和视觉概念，同时不需要使用边框注释实现最佳性能。

Dec, 2016

利用图像级监督学习空间规则化的多标签图像分类

本文提出了一种统一的深度神经网络模型，旨在解决多标签图像分类中标签的空间关系的问题。同时，该模型能够有效地利用语义和空间关系来提高分类性能，且只需要使用图像级别的监督信息进行端到端训练。实验表明，该模型在多个公共数据集上均具有较强的泛化能力，并且明显优于其他同类模型。

Feb, 2017

基于视觉注意力的无序RNN多标签分类

本文提出了用于多标签分类的联合学习注意力和循环神经网络模型，可有效利用注意力和LSTM模型，并且扩展了beam搜索技术以提高效率。

Jul, 2017

基于循环发现注意力区域的多标签图像识别

本文提出了一种利用深度学习技术中的循环记忆-关注模块来实现图像多标签分类识别的新方法。通过不使用候选区域提取方法，从卷积特征图中定位注意区域，并使用 LSTM 子网络对这些区域进行语义标记和全局依赖性的序列预测。试验表明该方法在识别准确率和效率上均优于现有技术。

Nov, 2017

基于图卷积网络的多标签图像识别

提出了一种基于图卷积网络的多标签分类模型，通过建立对象标签之间的图，学习一个对相互依赖的物体分类器的表示，同时使用重新加权的方法来创建有效的标签相关矩阵以指导 GCN 中节点之间的信息传播，在两个多标签图像识别数据集上实验证明了方法的有效性，并且可视化分析表明该模型学习到的分类器保持有意义的语义拓扑结构。

Apr, 2019

深度语义词典学习用于多标签图像分类

本文提出了一种新颖的端到端模型DSDL，将多标签图像分类问题视为字典学习任务，利用自动编码器将类级语义生成语义词典，利用字典表示CNN提取的视觉特征，同时通过APUS算法优化，为多标签图像分类问题提供了一种简单而优雅的解决方案，与现有技术相比具有更好的性能。

Dec, 2020

重新标记ImageNet：从单标签到多标签，从全局标签到本地标签

本文中，我们重新给ImageNet数据集打上多标签，并显示了使用有限多标签进行训练的图像分类模型的性能提升。

Jan, 2021

从单一正样本实现多标签学习

研究一种新的多标签图像分类问题，针对训练数据需要手动标注出所有适用标签的挑战，探索使用缺失标签进行学习的特殊情况，并尝试通过线性分类器和端到端微调深度网络提出新的损失函数来解决这个问题。结果表明，在一些情况下，使用更少的标签进行训练可以接近全部标签训练的性能水平。

Jun, 2021