重新标记ImageNet:从单标签到多标签,从全局标签到本地标签
本研究提出了一个深度卷积神经网络结构(HCP),可灵活应对多标签图像任务,并成功应用于Pascal VOC2007和VOC2012数据集中,表现优于其他同类算法,最大平均精度达到84.2%。
Jun, 2014
本文提出了一种基于卷积神经网络和循环神经网络的框架,用于多标签图像分类,通过学习图像标签嵌入特征,显式地利用了图像标签之间的关联性,拥有较好的分类性能。
Apr, 2016
提出使用多标记图像训练深度学习ResNet-101模型以提高图像的可视化质量,通过在大型分布式深度学习框架下进行多标签输出的高效训练,建立了一个大规模的多标签图像数据库,并通过传输学习任务验证了其可视化表示的良好质量。
Jan, 2019
该研究提出了一种使用部分标签进行多标签分类的方法,其中新的分类损失利用了每个示例已知标签的比例,并通过课程学习的策略预测遗漏标签。通过实验发现,该方法在MS COCO、NUS-WIDE和Open Images等三个大规模多标签数据集上取得了良好表现。
Feb, 2019
提出了一种基于图卷积网络的多标签分类模型,通过建立对象标签之间的图,学习一个对相互依赖的物体分类器的表示,同时使用重新加权的方法来创建有效的标签相关矩阵以指导 GCN 中节点之间的信息传播,在两个多标签图像识别数据集上实验证明了方法的有效性,并且可视化分析表明该模型学习到的分类器保持有意义的语义拓扑结构。
Apr, 2019
本文介绍了一种基于Weakly-supervised instance segmentation方法、称为Label-PEnet的分割网络,能够从图像级标签逐步转化到像素级标签,主要包含四个模块:多标签分类、目标检测、实例细化和实例分割,并通过Curriculum Learning策略将标签从高层次图像逐渐泛化到低层次像素。我们同时设计了一种Proposal Calibration模块来验证分类网络找到识别对象部件的关键像素的能力。实验结果表明,相比现有方法,Label-PEnet性能更好,甚至可以达到全监督方法的水平。
Oct, 2019
本研究探究了在进行多标签分类时,使用带每个类别的弱位置信息的方法来提高分类精度,同时采用主动学习策略,通过选择样本和获得反馈进行逐步监督,结果表明我们的方法与基线相比,在多个基准数据集和模型组合中表现均优秀,用此方法能够在 VOC 2007 和 2012 的数据集上,只使用20%的样本就可以保留超过98%的完全监督性能。
May, 2020
通过重新标注ImageNet数据集的验证集,本文发现现有的ImageNet分类器的性能提升要小于之前的报道,同时发现原始ImageNet标签不再是独立收集集的最佳预测变量,预示其在评估视觉模型方面的用途可能即将结束,但是本文采用的注释程序大大弥补了原始标签中的错误,为未来视觉识别研究提供了重要的基准。
Jun, 2020
本文研究了一种高效的策略收集多类别图像集的分类标签,使用自监督学习技术并将标注问题视为半监督学习问题,并提出了有效的标注指南,用此方案对ImageNet100图像集进行模拟实验,结果表明每张图像平均仅需0.35个标注,即可标注到80%的top-1准确率,相比之前的工作和手动注释,分别提高了2.7倍和6.7倍。
Apr, 2021
研究一种新的多标签图像分类问题,针对训练数据需要手动标注出所有适用标签的挑战,探索使用缺失标签进行学习的特殊情况,并尝试通过线性分类器和端到端微调深度网络提出新的损失函数来解决这个问题。结果表明,在一些情况下,使用更少的标签进行训练可以接近全部标签训练的性能水平。
Jun, 2021