从纪录片中发现和学习新物体
本文提出一种基于弱监督学习的目标检测和检索方法,通过对视频进行自然主体提取,使用对比采样处理背景拒绝,使用聚类评分算法解决高噪声标签问题,针对 11 个手动标注目标在 5000 帧中的评估结果与弱监督方法进行比较并提供上限参考。
May, 2019
该篇论文提出了一种从未加工过的视频中学习图像表示的方法,该方法将来自现成物体检测器的监督损失和自我监督损失相结合,取得了在 19 个迁移学习任务中有竞争力的结果,其中包括 18/19 的少样本学习任务和 8/8 的数据集泛化任务。
Oct, 2020
我们的研究工作在弱监督目标检测方面尝试利用不仅仅是物体类别标签,还使用数据中关联的动作标签;我们发现图像 / 视频中描绘的动作可以为相关物体的位置提供强烈的线索,并利用动作学习了一个与物体相关的空间先验,并将其融入到联合目标检测和动作分类模型中进行同时训练。我们在视频数据集和图像数据集上进行了实验来评估我们的弱监督目标检测模型的性能,结果表明,在 Charades 视频数据集上,我们的方法在 mAP 上比当前最先进的方法提高了 6% 以上。
Apr, 2019
本文提出了一种适用于移动摄像头、自适应于不同数据源的无监督多任务自学习算法,通过结合性地学习实例级追踪器,由此获得调整后的类别级物体检测器。
Jun, 2014
本文提出了一种称为开放词汇物体检测的新型物体检测问题,利用有限数量的物体分类边界框注释和图像 - 标题对来训练物体检测器,可以在更低的成本下覆盖更广泛的物体范围,成功地解决了物体检测中监督要求高的问题,并且更具实用性和效率,可以检测和定位那些未在训练过程中提供边界框注释的物体,无监督和零样本方法都无法做到如此高的准确性。
Nov, 2020
本文提出基于视频序列的目标发现和检测器适应方法,通过三个大型自动驾驶和移动机器人场景的视频数据集的应用,证明了其鲁棒性和广泛性,并提出了一种基于外观聚类的无监督物体发现方法,成功地发现了与驾驶场景相关的有趣物体,同时通过自监督检测器适应,进一步提高了现有类别在 KITTI 数据集的检测性能,可用于自主驾驶的大规模目标学习。
Dec, 2017
本文提出了一种基于知识迁移的新型目标检测算法,基于训练一个单一的多类目标检测器,可以实现在语义层次结构中的所有源类上训练。该技术可以应用于多个数据集,并且在 ILSVRC 2013 检测数据集上已经成功实现了目标检测领域的业界新纪录。
Aug, 2017
该论文介绍了一种利用弱标记视频中的跟踪对象框传输到弱标记图像中生成伪 Ground Truth 框的框架,用以训练对象检测器,该方法包括从弱标记图像集合中挖掘分辨率区域以形成伪 GT 框,然后设计霍夫变换算法对每个图像投票以选择最佳盒子,目前已在 PASCAL 2007 和 2010 数据集上实现了最先进的弱监督检测结果。
Apr, 2016
本文提出了基于新型弱标注的视频显著目标检测模型,并使用外观运动融合模块和双向 ConvLSTM 框架来实现有效的多模态学习和长期时序建模,还设计了一种前景背景相似度损失和一种弱标注增强策略,以提高模型性能和伪标签生成技术。在六个基准视频显著性检测数据集上的实验结果证明了我们方案的有效性。
Apr, 2021