从纪录片中发现和学习新物体

CVPRJul, 2017

Discover and Learn New Objects from Documentaries

Kai Chen, Hang Song, Chen Change Loy, Dahua Lin

TL;DR本文提出一种从纪录片中弱监督地学习对象检测器的方法，通过联合概率框架和训练集挖掘，初步实现了从视听资料中学习对象检测器的目标。

Abstract

Despite the remarkable progress in recent years, detecting objects in a new context remains a challenging task. Detectors learned from a public dataset can only work with a fixed list of categories, while training from scratch usually requires a large amount of training data with detailed annotations. This work aims to explore a novel approach -- learning ob

object detection weakly supervised learning documentary films probabilistic framework training set mining

发现论文，激发创造

从未标注的视频中学习对象检测与检索

本文提出一种基于弱监督学习的目标检测和检索方法，通过对视频进行自然主体提取，使用对比采样处理背景拒绝，使用聚类评分算法解决高噪声标签问题，针对 11 个手动标注目标在 5000 帧中的评估结果与弱监督方法进行比较并提供上限参考。

May, 2019

观察和学习：从视频中半监督学习目标检测器

本文提出一种半监督的方法，用于在长视频中定位多个未知的物体实例，通过这种方法可以有效地进行对象检测和跟踪，同时实现对大量静态物体实例的识别。

May, 2015

野外视频中的表示学习：以对象为中心的方法

该篇论文提出了一种从未加工过的视频中学习图像表示的方法，该方法将来自现成物体检测器的监督损失和自我监督损失相结合，取得了在 19 个迁移学习任务中有竞争力的结果，其中包括 18/19 的少样本学习任务和 8/8 的数据集泛化任务。

Oct, 2020

基于活动的弱监督目标检测

我们的研究工作在弱监督目标检测方面尝试利用不仅仅是物体类别标签，还使用数据中关联的动作标签；我们发现图像 / 视频中描绘的动作可以为相关物体的位置提供强烈的线索，并利用动作学习了一个与物体相关的空间先验，并将其融入到联合目标检测和动作分类模型中进行同时训练。我们在视频数据集和图像数据集上进行了实验来评估我们的弱监督目标检测模型的性能，结果表明，在 Charades 视频数据集上，我们的方法在 mAP 上比当前最先进的方法提高了 6% 以上。

Apr, 2019

自学摄影机：针对未标记视频流的目标检测器的自主适应

本文提出了一种适用于移动摄像头、自适应于不同数据源的无监督多任务自学习算法，通过结合性地学习实例级追踪器，由此获得调整后的类别级物体检测器。

Jun, 2014

使用字幕的开放词汇物体检测

本文提出了一种称为开放词汇物体检测的新型物体检测问题，利用有限数量的物体分类边界框注释和图像 - 标题对来训练物体检测器，可以在更低的成本下覆盖更广泛的物体范围，成功地解决了物体检测中监督要求高的问题，并且更具实用性和效率，可以检测和定位那些未在训练过程中提供边界框注释的物体，无监督和零样本方法都无法做到如此高的准确性。

Nov, 2020

从未标注的视频中进行大规模物体发现和探测器适应

本文提出基于视频序列的目标发现和检测器适应方法，通过三个大型自动驾驶和移动机器人场景的视频数据集的应用，证明了其鲁棒性和广泛性，并提出了一种基于外观聚类的无监督物体发现方法，成功地发现了与驾驶场景相关的有趣物体，同时通过自监督检测器适应，进一步提高了现有类别在 KITTI 数据集的检测性能，可用于自主驾驶的大规模目标学习。

Dec, 2017

重新审视知识转移在训练对象分类器中的作用

本文提出了一种基于知识迁移的新型目标检测算法，基于训练一个单一的多类目标检测器，可以实现在语义层次结构中的所有源类上训练。该技术可以应用于多个数据集，并且在 ILSVRC 2013 检测数据集上已经成功实现了目标检测领域的业界新纪录。

Aug, 2017

跟踪与传递：通过观看视频模拟强人类监督以进行弱监督目标检测

该论文介绍了一种利用弱标记视频中的跟踪对象框传输到弱标记图像中生成伪 Ground Truth 框的框架，用以训练对象检测器，该方法包括从弱标记图像集合中挖掘分辨率区域以形成伪 GT 框，然后设计霍夫变换算法对每个图像投票以选择最佳盒子，目前已在 PASCAL 2007 和 2010 数据集上实现了最先进的弱监督检测结果。

Apr, 2016

弱监督视频显著目标检测

本文提出了基于新型弱标注的视频显著目标检测模型，并使用外观运动融合模块和双向 ConvLSTM 框架来实现有效的多模态学习和长期时序建模，还设计了一种前景背景相似度损失和一种弱标注增强策略，以提高模型性能和伪标签生成技术。在六个基准视频显著性检测数据集上的实验结果证明了我们方案的有效性。

Apr, 2021