CNN: 单标签到多标签
本文提出了一种基于卷积神经网络的多视图多实例框架,用于提高物体检测中的特征表达和泛化能力,通过利用局部信息、弱标签和强标签有效地识别包含多个物体的多标签图像,实验结果表明该框架具有优异的鉴别力和泛化能力。
Apr, 2015
本文提出了一种基于卷积神经网络和循环神经网络的框架,用于多标签图像分类,通过学习图像标签嵌入特征,显式地利用了图像标签之间的关联性,拥有较好的分类性能。
Apr, 2016
本文提出了一种利用深度学习技术中的循环记忆-关注模块来实现图像多标签分类识别的新方法。通过不使用候选区域提取方法,从卷积特征图中定位注意区域,并使用 LSTM 子网络对这些区域进行语义标记和全局依赖性的序列预测。试验表明该方法在识别准确率和效率上均优于现有技术。
Nov, 2017
提出使用多标记图像训练深度学习ResNet-101模型以提高图像的可视化质量,通过在大型分布式深度学习框架下进行多标签输出的高效训练,建立了一个大规模的多标签图像数据库,并通过传输学习任务验证了其可视化表示的良好质量。
Jan, 2019
该研究提出了一种使用部分标签进行多标签分类的方法,其中新的分类损失利用了每个示例已知标签的比例,并通过课程学习的策略预测遗漏标签。通过实验发现,该方法在MS COCO、NUS-WIDE和Open Images等三个大规模多标签数据集上取得了良好表现。
Feb, 2019
提出了一种基于图卷积网络的多标签分类模型,通过建立对象标签之间的图,学习一个对相互依赖的物体分类器的表示,同时使用重新加权的方法来创建有效的标签相关矩阵以指导 GCN 中节点之间的信息传播,在两个多标签图像识别数据集上实验证明了方法的有效性,并且可视化分析表明该模型学习到的分类器保持有意义的语义拓扑结构。
Apr, 2019
本文提出了一种新颖的端到端模型DSDL,将多标签图像分类问题视为字典学习任务,利用自动编码器将类级语义生成语义词典,利用字典表示CNN提取的视觉特征,同时通过APUS算法优化,为多标签图像分类问题提供了一种简单而优雅的解决方案,与现有技术相比具有更好的性能。
Dec, 2020
本文提出了 Multi-label Transformer architecture(MlTr)并应用于多标签图像分类任务中,利用 windows partitioning、in-window pixel attention、cross-window attention 探索解决 CNN-based 方法遇到的关键问题并取得了性能显著提升。实验结果表明该方法在各种多标签数据集中表现出色,如 MS-COCO、Pascal-VOC 和 NUS-WIDE,分别达到 88.5%、95.8% 和 65.5%。
Jun, 2021
研究一种新的多标签图像分类问题,针对训练数据需要手动标注出所有适用标签的挑战,探索使用缺失标签进行学习的特殊情况,并尝试通过线性分类器和端到端微调深度网络提出新的损失函数来解决这个问题。结果表明,在一些情况下,使用更少的标签进行训练可以接近全部标签训练的性能水平。
Jun, 2021