通过语言和指点高效完成目标注释

CVPRMay, 2019

通过语言和指点高效完成目标注释

Efficient Object Annotation via Speaking and Pointing

Michael Gygli, Vittorio Ferrari

TL;DR利用语音交互技术优化深度学习目标检测中对数据集的标注工作，通过使用语音代替鼠标进行对象类别和边界框的注释，有效提高标注效率，实验表明该方法优于传统标注框架。

Abstract

deep neural networks deliver state-of-the-art visual recognition, but they rely on large datasets, which are time-consuming to annotate. These datasets are typically annotated in two stages: (1) determining the presence of object classes at the image level and (2) marking the spatial e

deep neural networks annotating speech-based interface object detection dataset

发现论文，激发创造

通过语音快速标记目标类别

该研究提出了一种基于语音的标注界面来减少目标类别标注所需的时间，并在 COCO 和 ILSVRC 等数据集上实验证明了该方法相较于现有方法可以在更短时间内获得高质量的标注。

Nov, 2018

室内场景目标检测的更快边界框标注

本文提出了一种快速边界框注释的方法，该方法分为两个阶段：第一步手动标注数据集的一部分，第二步采用第一阶段注释的模型对其余样本进行注释。我们还介绍了一个新的完全标记的室内场景物体检测数据集，使用几种最先进的模型对其训练，并在速度和准确性方面进行了比较。

Jul, 2018

使用点击监督训练目标分类器

本文提出了一种通过点击目标物体的中心点来标注边界框的标注方法，结合现有的弱监督目标定位技术，可在所有训练图像上联合定位目标边界框，与传统手动标注方法类似的定位出高质量目标检测器，标注时间可减少 9-18 倍。

Apr, 2017

点级监督的语义分割

本文提出了一种在训练期间可以节省标注成本的方法，该方法通过点级别标注和目标可能性将对象指向强监督引入到 CNN 模型的训练损失函数中，可以明显提高模型的准确性。

Jun, 2015

极端点击：高效的目标注释

借助极点标注代替传统的物体边界框标注方式可以有效提高标注速度，保证标注质量，同时较好的应用于物体检测和语义分割模型的训练中。

Aug, 2017

实时医学视频标注的即时点注释

我们提出了一种即时视频标注的方法来提高标注效率，通过在实时视频中保持光标在对象上的持续单点注释，减少传统标注方法中的暂停和重复导航需求，从而实现了 3.2 倍的标注速度提升，并在开发的数据集上在等价的标注预算下取得了 6.51+-0.98 AP@50 的均值改善。

Apr, 2024

目标检测中的嘈杂标注精炼

本研究提出了一种新的方法来在包含类标注和边界框注释的噪声数据集上训练目标检测器，能高效地分离这些噪音并进行纠正，使训练得到的检测器能够显著优于基准检测器。

Oct, 2021

利用室内定位系统标定的自动多模态数据标注

通过融合 LiDAR 和相机数据的学习目标检测方法需要带有标签的训练样本，然而某些特定应用（如仓储机器人或自动化基础设施）需要在现有数据集中没有的语义类别。因此，为了促进快速创建多模态目标检测数据集并减轻人工标注的负担，我们提出了一种新颖的自动标注流程。我们的方法使用室内定位系统（IPS）为点云和图像生成准确的检测标签，完全消除了手动标注的需求。在一项实验中，该系统比与人类基准相比，快速标注感兴趣的物体的速度提高了 261.8 倍，并将端到端数据集创建速度加快了 61.5%。

Dec, 2023

带可见状态的边界框注释

提出了一种通过移动相机进行捕捉的自动化注释方法，并通过游戏化应用程序特性来捕获多视图图像数据集，降低了人们的心理负担和时间压力，从而增加了参与度。

Apr, 2023

与人类标注者进行大规模交互式物体分割

本文提出了一种基于深度交互式分割模型的交互式对象分割方法，并利用真实人类注释数据集发布了一个实例分割数据集，同时还提供了一个自动评估模型以更好地保证注释质量。

Mar, 2019