基于边缘耦合字典学习的实时图像标注
该研究提出了一种从用户提供的标签中直接学习图像分类的方法,使用大规模的分类算法和校准过程来分析 Flickr 100 Million Image 数据集。结果表明,与昂贵的手动注释相比,免费可用的用户标签可以获得类似或更优异的结果。
Nov, 2014
该研究提出了一种新的递归图像注释器(RIA)模型,将图像注释任务形成为序列生成问题,以便RIA可以根据图像内容本地预测正确的标记长度。 该模型在各种图像注释数据集上进行了评估,并显示其在任意长度图像标记任务上作为高质量基准的能力。 此外,实验结果表明,在训练阶段中标记的顺序对最终注释性能有很大影响。
Apr, 2016
本文提出了一种基于核规范相关分析(KCCA)的标签传播框架,能够构建一个潜在的语义空间来嵌入视觉和文本特征之间的相关性,并在四个数据集上展示了显著的改进。该方法不仅可以处理专家标注的数据集,还可以处理社交媒体上用户自动生成标签的嘈杂数据。
May, 2016
本文提出了一种弱监督的图像注释模型,利用深度神经网络进行特征学习和标注模型,在批次级别上引入视觉一致性、语义依赖和用户误差稀疏等约束来减轻标签噪音, 实现同时优化模型和优化用户提供标签的目的,并在两个基准数据集上取得了最佳性能。
Nov, 2017
本论文提出了一种上下文感知图像注释框架(CAIAF),利用图像元数据作为相似性度量将图像聚类成组进行注释,并在注释界面上为每张图像提供有用的元数据信息作为上下文,实验结果表明它相对于传统框架减少了注释成本,同时保持了高分类性能。
Feb, 2020
本研究对图像标注软件进行了系统性的文献综述和分类,提出了组织结构、用户界面设计选项和用户支持技术的体系化方案,并应用于现有软件和文献领域,揭示了多个应用原型和关键领域,如医疗保健或电视中的图像检索或实例识别。
Apr, 2021
本文研究了一种高效的策略收集多类别图像集的分类标签,使用自监督学习技术并将标注问题视为半监督学习问题,并提出了有效的标注指南,用此方案对ImageNet100图像集进行模拟实验,结果表明每张图像平均仅需0.35个标注,即可标注到80%的top-1准确率,相比之前的工作和手动注释,分别提高了2.7倍和6.7倍。
Apr, 2021
在基于图像标题检索的任务中,三元组损失与半硬负例已成为从头开始优化的方法的事实选择。最近度量学习的进展已经产生了比三元组损失在图像检索和特征表示等任务上效果更好的损失函数。本文通过比较两种基于图像标题检索方法上的三种损失函数来回答这个问题,结论是否定的:在基于图像标题检索的任务中,三元组损失与半硬负例仍然优于度量学习中新近引入的损失函数。我们使用一种计数方法来进行分析来获得更好的理解这些结果。
Feb, 2022
利用vTelos方法结合自然语言处理、知识表示和计算机视觉技术,通过利用WordNet词汇-语义层次结构来明确图像注释的含义,从而减少主观选择,实现了显式的注释语义。
Jul, 2023