计算机视觉应用图像标注调查

Apr, 2021

A survey of image labelling for computer vision applications

Christoph Sager, Christian Janiesch, Patrick Zschech

TL;DR本研究对图像标注软件进行了系统性的文献综述和分类，提出了组织结构、用户界面设计选项和用户支持技术的体系化方案，并应用于现有软件和文献领域，揭示了多个应用原型和关键领域，如医疗保健或电视中的图像检索或实例识别。

Abstract

supervised machine learning methods for image analysis require large amounts of labelled training data to solve computer vision problems. The recent rise of →

supervised machine learning image analysis deep learning algorithms image labelling software structured literature review

发现论文，激发创造

具有深度学习和自然语言能力的辅助图像标注系统：一项综述

本研究论文探讨了在计算机视觉任务中，超分辨率学习取得了显著的成功，但获取高质量的标注数据仍然是一个瓶颈。作者调查了 AI 辅助深度学习图像标注系统的学术和非学术作品，这些系统为注释者提供关于输入图像的文本建议、标题或描述，从而提高注释效率和质量。研究涵盖了各种计算机视觉任务的标注，包括图像分类、目标检测、回归、实例、语义分割和姿态估计。作者回顾了各种数据集以及它们对 AI 辅助标注系统的训练和评估的贡献。此外，作者还研究了利用神经符号学习、深度主动学习和自监督学习算法实现语义图像理解和生成自由文本输出的方法，包括图像字幕生成、视觉问答和多模态推理。尽管前景看好，但 AI 辅助图像标注与文本输出能力的公开可用作品有限。文章最后提出了未来研究方向的建议，强调了更多公开可用的数据集和学术界与工业界合作的必要性。

Jun, 2024

从互联网提取视觉知识：理解图像数据

本研究针对视觉识别技术中的特征表示、学习算法和标记的训练数据进行了探究，提出了一种基于网络监督的自动图像数据生成方法，以实现对大量视觉概念的高效训练和识别。在 Pascal VOC 2007 数据集上对该方法进行了测试，并取得了明显的优越性能。

Jun, 2019

利用深度学习进行图像分割：综述

本文综述了关于图像分割的研究，特别关注了基于深度学习模型的语义分割和实例分割方法，包括全卷积像素标定网络、编码器 - 解码器架构、多尺度与基于金字塔的方法、循环神经网络、视觉注意力模型和对抗生成模型。我们探讨了这些深度学习模型的相似性，能力和挑战，并讨论了未来的研究方向。

Jan, 2020

大规模图像分类数据集高效标注的良好实践

本文研究了一种高效的策略收集多类别图像集的分类标签，使用自监督学习技术并将标注问题视为半监督学习问题，并提出了有效的标注指南，用此方案对 ImageNet100 图像集进行模拟实验，结果表明每张图像平均仅需 0.35 个标注，即可标注到 80% 的 top-1 准确率，相比之前的工作和手动注释，分别提高了 2.7 倍和 6.7 倍。

Apr, 2021

卷积神经网络引导标注

本文提出了一种 guided labeling 方法，可以自动确定从未标记的数据集中应该标记哪些样本，从而显著地减少了需要手动标记的样本数量。

Dec, 2017

计算机视觉任务的深度学习综述

本文旨在概述深度学习算法在计算机视觉领域的应用，包括图像分类，目标识别，图像提取和语义分割等方面，同时讨论了构建和训练深度神经网络面临的未来范围和挑战。

Apr, 2018

利用人机交互提升计算机视觉数据集质量

本研究引入了一个轻量级、用户友好、可扩展的框架 “Multilabelfy”，通过人机智能的协同作用，实现了高效的数据集验证和质量提升，同时突出了多标签占比的重要性，发现 ImageNetV2 数据集中约 47.88% 的图像包含至少两个标签，这凸显了对这类有影响力的数据集更严格评估的需求，并揭示了潜在标签数与模型准确性之间的负相关关系。

Jan, 2024

深度学习在生物医学图像分类中使用自动标签与手动标签同样有效

研究探讨在何种情况下可以采用自动标签来训练深度学习模型进行癌症组织切片图像分类，结果发现具有 10% 噪声标签的自动标签可以获得竞争性模型，而应用 Semantic Knowledge Extractor Tool (SKET) 算法生成的自动标签表现与手动标签相当，达到了与手动标签训练模型相当的稳定性能。

Jun, 2024

非完全监督：医学图像分析中的半监督、多实例和迁移学习调查

机器学习在医学影像领域取得显著进展。针对缺少标注数据，我们总结介绍了如何使用半监督、多示例、迁移学习等学习方法，特别是针对诊断和分割任务。同时，我们探讨了这些学习方法之间的联系和未来的研究机会。

Apr, 2018

计算机视觉中的众包

本篇论文调查了计算机视觉中使用众包方法进行数据标注的类型，并讨论了一些有效的数据采集界面和工作流设计决策，以及智能选取最重要的数据实例进行注释的策略，最后探讨了众包在计算机视觉领域的未来发展。

Nov, 2016