深度物体检测的上下文评估

May, 2022

Evaluating Context for Deep Object Detectors

Osman Semih Kayhan, Jan C. van Gemert

TL;DR本论文系统地评估了三类深度物体检测器（无上下文、部分上下文和完整上下文），并在 MS COCO 上研究了物体检测的上下文效果，结果表明单阶段和双阶段的物体检测器都能够利用上下文，因此选择最佳物体检测器可能取决于应用场景。

Abstract

Which object detector is suitable for your context sensitive task? Deep object detectors exploit scene context for recognition differently. In this paper, we group →

发现论文，激发创造

目标检测的关注上下文

通过开发一种名为AC-CNN的新型神经网络模型，将全局和局部上下文信息有效地结合到区域卷积神经网络中，提高了目标检测性能，特别是在PASCAL VOC 2007和VOC 2012数据集上，与目前主流的Fast-RCNN算法相比在mAP方面分别提高了2.0％和2.2％

Mar, 2016

基于深度特征的目标检测上下文模型

本文提出了一种综合局部外观特征，对象关系的上下文信息和全局场景上下文特征的集合物体检测系统，该系统采用基于对象建议的完全连接条件随机场（CRF）进行建模，并利用快速平均场近似方法有效地进行CRF 模型中的推理，实验结果表明，与基线算法 Faster R-CNN 相比，我们的方法在 PASCAL VOC 2007 数据集上实现了更高的平均精度（mAP）.

Apr, 2016

上下文选择在目标检测中的作用

研究对象检测中上下文限制效果有限的原因，提出了一种基于区域的上下文重新评分方法，该方法采用动态上下文选择来消除噪声并强调信息上下文，实验表明该方法在性能评估方面显著优于外观检测器和传统上下文模型。

Sep, 2016

上下文感知型单-shot检测器

CSSD是一种基于SSD的多尺度上下文感知单发多框物体检测器，通过添加上下文层在检测小物体时取得了较好的效果。

Jul, 2017

从共同出现的物体类别的角度分析物体检测器

本研究基于特殊遮盖的MS COCO数据集，对目前最先进的Faster R-CNN和YOLO目标检测器的准确性进行评估和比较，以衡量它们的预测有多少依赖于编码在对象类别级别上的上下文信息。研究结果表明，当前检测器通常不会在类别级别上建立强的依赖关系，但是当它们这样做时，它们的方式往往相似，表明对象类别的上下文依赖性是一个独立的属性，这具有传递知识的相关性。

Sep, 2018

深度上下文关注人-物互动检测

提出了一种上下文关注框架，通过学习上下文感知的人和对象外观特征，并采用自适应方法选择相关实例中心的上下文信息以突出可能包含人物-物品交互的图像区域，从而在三个数据集上超越现有最佳方法。

Oct, 2019

利用上下文和注意力进行小目标检测

提出了一种利用上下文改进小目标检测准确性的方法，该方法使用不同层的多尺度特征作为上下文来增强小目标检测的准确性，并提出带有注意机制的物体检测方法，可以专注于图像中的对象并包括目标层的上下文信息。实验结果表明，该方法在检测小目标方面的准确性比传统SSD更高，在PASCAL VOC2007测试集上实现了78.1％的mAP。

Dec, 2019

Context-Transformer: 解决Few-Shot检测中的目标混淆问题

针对少样本目标检测的问题，我们提出了一种基于 Context-Transformer 的深度迁移学习方法，该方法可以巧妙地利用源域目标知识，从少量样本中自动利用上下文信息以提高检测器的区分能力，并在 popular SSD-style 检测器中灵活嵌入，从而成为端到端少样本学习的即插即用模块。实验结果表明，我们的框架优于最新的 state-of-the-art 方法。

Mar, 2020

基于知识图谱的上下文驱动视觉对象识别

通过将语境知识编码到知识图中，提高深度学习方法的鲁棒性，增强物体识别模型对于跨领域和真实世界场景的表现。

Oct, 2022

GMC: 一种用于视觉检测任务的多阶段上下文学习与利用的通用框架

提出了GMC框架，用于多阶段上下文学习和利用的通用框架，利用各种深度网络架构进行各种视觉检测任务。GMC框架包括三个阶段：预处理、训练和后处理，并通过结合语义上下文信息和视觉信息，以及利用训练数据集中的先验知识捕捉语义关系，在对象之间实现空间上下文推理。框架灵活适应用户定义的配置和多样化的网络架构和视觉检测任务，提供了一个自动化和高效的解决方案，在上下文学习和推理中最大程度地减少用户的工作量和推理时间，并在视觉检测任务中展示了超越先前状态-of-the-art检测器和变换器架构的实验结果。实验还证明了三个上下文学习组件不仅可以单独应用，也可以组合应用，并且可以应用于各种网络架构，在各种检测场景下具有灵活性和高效性。

Jul, 2024