CNN-RNN:一种多标签图像分类的统一框架
本研究提出了一个深度卷积神经网络结构(HCP),可灵活应对多标签图像任务,并成功应用于Pascal VOC2007和VOC2012数据集中,表现优于其他同类算法,最大平均精度达到84.2%。
Jun, 2014
本文研究为了改进多标签分类与图像标注任务中CNN-RNN设计模式,在CNN与RNN之间引入一个有着语义规范化的嵌入层,以分离学习任务并使得训练更加高效。实验证明,该模式取得了多标签分类与图像标注任务的最新成果。
Nov, 2016
本论文提出了一种区域潜在语义依赖模型,该模型使用卷积神经网络和递归神经网络相结合,能够有效预测多标签图像分类中小物体和视觉概念,同时不需要使用边框注释实现最佳性能。
Dec, 2016
本文提出了一种统一的深度神经网络模型,旨在解决多标签图像分类中标签的空间关系的问题。同时,该模型能够有效地利用语义和空间关系来提高分类性能,且只需要使用图像级别的监督信息进行端到端训练。实验表明,该模型在多个公共数据集上均具有较强的泛化能力,并且明显优于其他同类模型。
Feb, 2017
本文提出了一种利用深度学习技术中的循环记忆-关注模块来实现图像多标签分类识别的新方法。通过不使用候选区域提取方法,从卷积特征图中定位注意区域,并使用 LSTM 子网络对这些区域进行语义标记和全局依赖性的序列预测。试验表明该方法在识别准确率和效率上均优于现有技术。
Nov, 2017
提出了一种基于图卷积网络的多标签分类模型,通过建立对象标签之间的图,学习一个对相互依赖的物体分类器的表示,同时使用重新加权的方法来创建有效的标签相关矩阵以指导 GCN 中节点之间的信息传播,在两个多标签图像识别数据集上实验证明了方法的有效性,并且可视化分析表明该模型学习到的分类器保持有意义的语义拓扑结构。
Apr, 2019
本文提出了一种新颖的端到端模型DSDL,将多标签图像分类问题视为字典学习任务,利用自动编码器将类级语义生成语义词典,利用字典表示CNN提取的视觉特征,同时通过APUS算法优化,为多标签图像分类问题提供了一种简单而优雅的解决方案,与现有技术相比具有更好的性能。
Dec, 2020
研究一种新的多标签图像分类问题,针对训练数据需要手动标注出所有适用标签的挑战,探索使用缺失标签进行学习的特殊情况,并尝试通过线性分类器和端到端微调深度网络提出新的损失函数来解决这个问题。结果表明,在一些情况下,使用更少的标签进行训练可以接近全部标签训练的性能水平。
Jun, 2021