图像标注笔记
本研究对图像标注软件进行了系统性的文献综述和分类,提出了组织结构、用户界面设计选项和用户支持技术的体系化方案,并应用于现有软件和文献领域,揭示了多个应用原型和关键领域,如医疗保健或电视中的图像检索或实例识别。
Apr, 2021
本文研究了一种高效的策略收集多类别图像集的分类标签,使用自监督学习技术并将标注问题视为半监督学习问题,并提出了有效的标注指南,用此方案对 ImageNet100 图像集进行模拟实验,结果表明每张图像平均仅需 0.35 个标注,即可标注到 80% 的 top-1 准确率,相比之前的工作和手动注释,分别提高了 2.7 倍和 6.7 倍。
Apr, 2021
我们引入了一个新的任务,标签指令生成,旨在解决缺少公开可用的标注说明的问题,我们介绍了一个无需模型训练的框架,并使用一个新创建的快速检索系统,利用大型预训练视觉和语言模型,生成数据集类别的多个不同的视觉和文本表示,我们优化后的标注指令集在 5 个折叠中比 NuImages 高出 7.06 mAP,比 COCO 高出 12.9 mAP。
Jun, 2023
本文提出了一项新颖的任务,即追踪人类学习者在进行挑战性的视觉分类任务时不断演变的分类行为,提出了一种新的视觉知识追踪模型,并收集三个挑战性的新数据集,从而评估不同的视觉知识追踪方法的性能,结果表明我们的循环模型能够预测人类学习者在三个挑战性的医学图像和物种识别任务中的分类行为。
Jul, 2022
本研究论文探讨了在计算机视觉任务中,超分辨率学习取得了显著的成功,但获取高质量的标注数据仍然是一个瓶颈。作者调查了 AI 辅助深度学习图像标注系统的学术和非学术作品,这些系统为注释者提供关于输入图像的文本建议、标题或描述,从而提高注释效率和质量。研究涵盖了各种计算机视觉任务的标注,包括图像分类、目标检测、回归、实例、语义分割和姿态估计。作者回顾了各种数据集以及它们对 AI 辅助标注系统的训练和评估的贡献。此外,作者还研究了利用神经符号学习、深度主动学习和自监督学习算法实现语义图像理解和生成自由文本输出的方法,包括图像字幕生成、视觉问答和多模态推理。尽管前景看好,但 AI 辅助图像标注与文本输出能力的公开可用作品有限。文章最后提出了未来研究方向的建议,强调了更多公开可用的数据集和学术界与工业界合作的必要性。
Jun, 2024
本文介绍了一种新的大规模、公共的室内场景阴影注释数据集,并用该数据集训练了一种卷积神经网络,以预测图像中每个像素的阴影信息,并在内在图像的应用中展示了我们的数据和网络的价值。
May, 2017
通过部分自动化标记方案,我们扩大人类工作量,借助深度学习来提高图像分类的准确性,并构建一个新的图像数据集 LSUN,这对于进一步的视觉识别研究具有重要作用。
Jun, 2015
本研究针对视觉识别技术中的特征表示、学习算法和标记的训练数据进行了探究,提出了一种基于网络监督的自动图像数据生成方法,以实现对大量视觉概念的高效训练和识别。在 Pascal VOC 2007 数据集上对该方法进行了测试,并取得了明显的优越性能。
Jun, 2019
本文探讨机器学习中的数据注释实践,包括数据注释的定义和其对标签的意义进行赋予的过程。作者对注释公司进行了田野调查,分析了结构、权力关系和自然化规定是如何影响数据的解释的。结果表明,在注释工作中,标签通常是从其他具有更高权力、其他利益、价值和优先事项的人员那里产生的。这个发现指出,数据的解释过程涉及到多个人员和社会的权力问题。
Jul, 2020