强化学习改进目标检测

ECCVAug, 2020

Reinforcement Learning for Improving Object Detection

Siddharth Nayak, Balaraman Ravindran

TL;DR介绍一种名为 ObjectRL 的算法，可以决定应当应用多少特定的图像预处理方法来提高预训练网络的目标检测性能，因为对于神经网络而言，人眼看来好的图像未必是最优的。

Abstract

The performance of a trained object detection neural network depends a lot on the image quality. Generally, images are pre-processed befor

object detection neural network pre-processing objectrl performance

发现论文，激发创造

基于深度强化学习的大图像目标检测方法

为了减少使用高空间分辨率图像所带来的计算和货币成本，我们提出了一种强化学习代理，该代理自适应地选择提供给探测器的每个图像的空间分辨率，并使用双重奖励设置对代理进行训练，以选择低空间分辨率图像，以运行粗级探测器，同时选择高空间分辨率图像，则运行精细级探测器，该方法在维持与仅使用高分辨率图像的检测器相似的准确性的同时，将运行时间效率提高了 50％，只使用高分辨率图像 30％的时间

Dec, 2019

多阶段强化学习用于目标检测

采用强化学习方法进行对象检测，采用预定义区域候选树、缩放操作和优化奖励函数等技术手段，实现更精准的物体边框配置。

Oct, 2018

深度强化学习目标检测

本文介绍了一种基于深度强化学习的主动目标定位算法，比较了两种不同的决策过程方法：分层方法和动态方法，并进一步通过调整不同的超参数和架构变化对模型性能进行了消融研究。

Aug, 2022

视频视觉目标跟踪的深度强化学习

本文提出一种全面的端到端视频视觉跟踪方法，利用循环卷积神经网络代理与视频进行交互，并结合强化学习算法来学习不断的关注连续帧相关性和最大化在长期内的跟踪性能，实现了比现有跟踪基准更快速的状态 - of-the-art 性能。是第一个将卷积和循环网络与强化学习算法相结合的神经网络跟踪器。

Jan, 2017

预训练物体中心表征在强化学习中的探究

本文通过实验探究并系统评估 OCR 预训练对于基于图像的强化学习原型任务的影响及其局限性，研究结果为在某些情况下 OCR 预训练使用的潜在局限性提供了实证证据，并分析了影响 OCR 预训练在强化学习中应用的关键因素，包括在视觉复杂环境中的性能和适当的汇聚层以聚合对象表示。

Feb, 2023

基于实体为中心的从像素到目标操控的强化学习

这项研究提出了一种适用于表示多个物体及其相互作用的可视强化学习结构化方法，用于学习多个物体的目标条件操纵，并演示了学习使用三个物体但能推广到具有十多个物体的类似任务的代理的能力。

Apr, 2024

目标敏感的深度强化学习

该研究提出了一种新方法，可以将物体识别处理引入深度强化学习模型，提供了一种新方法来解释深度强化学习智能体的行动，并在 Atari 游戏方面取得了最先进的结果。

Sep, 2018

使用低维观测滤波器的深度强化学习在视觉复杂游戏中的应用

本论文提出了一种低维观察过滤器，使深度 Q 网络代理能够在视觉复杂的现代视频游戏（Neon Drive）中成功玩耍。

Apr, 2022

使用深度强化学习进行层次化物体检测

本文提出了一种使用深度强化学习引导的层级目标检测方法，通过选择含有更多信息的图像部分并对其进行放大来不断迭代提高图像的分析效果，并比较了两种不同的候选对象建议策略，以指导对象搜索，实验表明，采用重叠的候选建议策略和为每个区域建议计算特征映射的第一种策略能够取得更好的结果。

Nov, 2016

奖励微调以提高更快和更准确的无监督目标发现

通过利用人类反馈进行强化学习，无监督对象发现的准确性和训练速度得到了显著提高。

Oct, 2023