加强上下文在区域词对齐中的作用以进行目标检测

Mar, 2023

加强上下文在区域词对齐中的作用以进行目标检测

Enhancing the Role of Context in Region-Word Alignment for Object Detection

Kyle Buettner, Adriana Kovashka

TL;DR本研究探索语言上下文对目标检测的影响，并提出了一种增强上下文作用的方法，特别是属性等语境，以提高区域 - 词对齐性能。该方法在区域 - 词预训练方面超越了最先进技术，并通过文本 - 区域检索和短语命名分析展示了属性敏感模型的细粒度实用性。

Abstract

vision-language pretraining to learn a fine-grained, region-word alignment between image-caption pairs has propelled progress in open-vocabulary object detection. We observe that →

vision-language pretraining region-word alignment object detection language context attributes

发现论文，激发创造

开放词汇目标检测的学习目标语言对齐

提出了一种使用自然语言监督学习从配对的图像文本数据中直接学习的新型开放词汇目标检测框架，通过将对象 - 语言对齐形式化为一个图像区域特征集合和一个词向量集合之间的集合匹配问题，可以更简单和有效地在图像 - 文本对上训练开放词汇对象探测器，并在两个基准数据集上进行了广泛的实验，在 LVIS 等新类别上实现了 32.0％的 mAP 和 21.7％的掩膜 mAP 等卓越性能。

Nov, 2022

超越预训练目标检测器：图像字幕生成中的跨模态文本和视觉语境

本文提出了一种通过添加辅助输入以表示缺失信息（例如物体关系）来改进视觉描述模型的方法，并使用来自 Visual Genome 数据集的属性和关系对该模型进行调整。在图像标题生成实验中，该方法取得了良好的表现。

May, 2022

上下文与属性基础的密集字幕

本文提出了一种基于上下文推理和多级属性的视觉挖掘及区域描述生成的密集字幕框架，并利用层次化语义属性提供辅助监督，实验结果表明该模型优于现有最先进的方法。

Apr, 2019

不要断章取义：统一的视觉语言预训练为上下文辅助的图像字幕生成

本文提出了一个基于 context-aware image captioning 的 unified Vision-Language (VL) model，并利用 pretraining 技术解决了 context-independent 问题，以达到比以前更好的效果。

Jun, 2023

RegionCLIP: 基于区域的语言 - 图像预训练

RegionCLIP 是一种新的方法，扩展了 CLIP 模型的范围，使其可以学习区域级别的视觉表征，从而实现图像区域和文本概念之间的细粒度对齐，进而在目标检测领域表现出良好的性能。

Dec, 2021

上下文选择在目标检测中的作用

研究对象检测中上下文限制效果有限的原因，提出了一种基于区域的上下文重新评分方法，该方法采用动态上下文选择来消除噪声并强调信息上下文，实验表明该方法在性能评估方面显著优于外观检测器和传统上下文模型。

Sep, 2016

分布式注意力用于基于图像描述的场景理解

该研究针对弱监督概念下的图片描述问题，提出了一种基于分布式注意力机制和局部连接信息的部分地基准技术，可以帮助生成最佳的图片描述。

Aug, 2021

ContextLocNet: 上下文感知的弱监督本地化深度网络模型

该研究利用图像级别监督，通过引入两种上下文感知的模型来实现目标在图像中的定位，加性模型和对比模型有助于定位目标的位置，在 Pascal VOC2007 和 2012 测试中表现出较好的效果。

Sep, 2016

弱监督词组定位的对比学习

本文介绍了一种通过优化单词 - 区域关注力最大化互信息的方法来学习短语定位，该方法通过利用经过语言模型引导的单词替换来构建有效的负面标题进行训练，进而实现对 CO-Captions 数据集的短语 grounding，使精度提高了 5.7%。

Jun, 2020

面向检测的图像 - 文本预训练的开放词汇测量

基于检测导向的图像 - 文本预训练的新的开放词汇检测方法用于填补图像级预训练和开放词汇对象检测之间的差距，通过使探测器头从嘈杂的图像 - 文本对中学习，我们的方法能够利用对比损失学习到新出现的对象 - 语义线索，在 LVIS 和 COCO 基准测试中均获得了非常有竞争力的结果，并在转移检测设置中显著优于基线。

Sep, 2023