通过深度强化学习和专家演示实现的视觉追踪

ICCVSep, 2019

通过深度强化学习和专家演示实现的视觉追踪

Visual Tracking by means of Deep Reinforcement Learning and an Expert Demonstrator

Matteo Dunnhofer, Niki Martinel, Gian Luca Foresti, Christian Micheloni

TL;DR通过应用强化学习的最新趋势并借鉴专家代理的演示，提出了两种新型跟踪器：A3CT 和 A3CTD，均利用现有的跟踪器进行有效的跟踪，并在多个基准测试中取得了最新的成果。

Abstract

In the last decade many different algorithms have been proposed to track a generic object in videos. Their execution on recent large-scale video datasets can produce a great amount of various tracking behaviours. New trends in reinforcement learning showed that demonstrations of an

object tracking reinforcement learning expert agent real-time tracking benchmarking

发现论文，激发创造

端到端主动物体追踪及其通过强化学习实际部署

本研究通过深度强化学习解决了目标跟踪和摄像头控制任务难以共同调整的问题，并在模拟器上训练的跟踪器表现出良好的泛化能力，且具备潜在的真实场景应用价值。

Aug, 2018

基于强化学习的端到端主动目标跟踪

本研究采用深度强化学习的端到端方法，结合 ConvNet-LSTM 函数的预测能力，提出了一种针对活动物体追踪的解决方案，并通过环境增强技术和定制的奖励函数进行训练。结果表明，在模拟器中训练的跟踪器能够在未知的物体移动路径、外观、背景和干扰物的情况下表现良好。实验还表明，单独在模拟器中训练的跟踪能力具有潜在的适用性和推广性，可以在真实情况下进行。

May, 2017

视频视觉目标跟踪的深度强化学习

本文提出一种全面的端到端视频视觉跟踪方法，利用循环卷积神经网络代理与视频进行交互，并结合强化学习算法来学习不断的关注连续帧相关性和最大化在长期内的跟踪性能，实现了比现有跟踪基准更快速的状态 - of-the-art 性能。是第一个将卷积和循环网络与强化学习算法相结合的神经网络跟踪器。

Jan, 2017

基于深度强化决策的实时视觉跟踪

该研究提出了一种基于深度强化学习方法构建的模板选择策略的实时视觉追踪算法，该算法可有效应对模型更新导致的跟踪偏移问题，可在实时速度下以 43fps 跑动。

Feb, 2017

TrackAgent: 通过强化学习进行 6D 物体追踪

追踪物体的六维姿态，在物体本身或观察相机移动时，对许多机器人学和增强现实应用非常重要。在跟踪任务的严格时间限制下，我们提出了将物体追踪简化为加强点云（仅深度）对齐任务的方法。

Jul, 2023

视觉跟踪的深度学习：一项综述

本文对深度学习手段在视觉目标跟踪中的应用作了全面综述，包括常用的数据集、评估指标以及当前领先的跟踪器，并对它们进行了量化和定性分析，旨在为实践者在选择方案时提供指导和对未来方向进行探讨。

Dec, 2019

以在线决策为跟踪基础：通过强化学习从实时视频中学习策略

本文提出了一种基于 POMDP 模型的跟踪算法，该算法使用强化学习算法进行决策，并以稀疏奖励信号为辅助训练，旨在解决跟踪过程中图像模糊和计算资源受限等问题。同时，該算法使用互联网视频数据源进行跟踪器的训练和评估，从而逐步解决跟踪数据不足等问题。

Jul, 2017

基于深度强化学习的室内场景目标驱动视觉导航

本研究解决深度强化学习的一些问题，如模型推理泛化能力差和数据效率低。提出一种策略演员 - 评论家模型，以目标以及当前状态为函数，并在 AI2-THOR 框架下应用模型以与物体交互，实现在 3D 场景中进行大量样本高效收集，易于应用到现实场景并无需进行特征匹配。

Sep, 2016

深度强化学习下的端到端赛车驾驶

本文提出了使用最新的强化学习算法进行端到端驾驶研究，仅使用来自前置摄像头的 RGB 图像，通过异步演员 - 评论家 (A3C) 框架在真实的赛车游戏中学习车辆控制，并在不同的道路结构、图形和物理特性下进行评估。结果表明本方法可以快速收敛和更稳健的驾驶，同时在看不见的赛道上和法定车速下进行了广义化证明。同时，我们的方法在实际影像序列上显示出一定的领域适应能力。

Jul, 2018

使用深度强化学习对 UR10e 机械臂进行视觉跟踪和到达学习

通过应用深度强化学习在工业 UR10e 机器人上的研究，我们发现近端策略优化比深度 Q 学习具有更好、更稳定的策略，而且使用更少的数据。

Aug, 2023