通过深度强化学习和专家演示实现的视觉追踪
本研究通过深度强化学习解决了目标跟踪和摄像头控制任务难以共同调整的问题,并在模拟器上训练的跟踪器表现出良好的泛化能力,且具备潜在的真实场景应用价值。
Aug, 2018
本研究采用深度强化学习的端到端方法,结合 ConvNet-LSTM 函数的预测能力,提出了一种针对活动物体追踪的解决方案,并通过环境增强技术和定制的奖励函数进行训练。结果表明,在模拟器中训练的跟踪器能够在未知的物体移动路径、外观、背景和干扰物的情况下表现良好。实验还表明,单独在模拟器中训练的跟踪能力具有潜在的适用性和推广性,可以在真实情况下进行。
May, 2017
本文提出一种全面的端到端视频视觉跟踪方法,利用循环卷积神经网络代理与视频进行交互,并结合强化学习算法来学习不断的关注连续帧相关性和最大化在长期内的跟踪性能,实现了比现有跟踪基准更快速的状态 - of-the-art 性能。是第一个将卷积和循环网络与强化学习算法相结合的神经网络跟踪器。
Jan, 2017
该研究提出了一种基于深度强化学习方法构建的模板选择策略的实时视觉追踪算法,该算法可有效应对模型更新导致的跟踪偏移问题,可在实时速度下以 43fps 跑动。
Feb, 2017
追踪物体的六维姿态,在物体本身或观察相机移动时,对许多机器人学和增强现实应用非常重要。在跟踪任务的严格时间限制下,我们提出了将物体追踪简化为加强点云(仅深度)对齐任务的方法。
Jul, 2023
本文对深度学习手段在视觉目标跟踪中的应用作了全面综述,包括常用的数据集、评估指标以及当前领先的跟踪器,并对它们进行了量化和定性分析,旨在为实践者在选择方案时提供指导和对未来方向进行探讨。
Dec, 2019
本文提出了一种基于 POMDP 模型的跟踪算法,该算法使用强化学习算法进行决策,并以稀疏奖励信号为辅助训练,旨在解决跟踪过程中图像模糊和计算资源受限等问题。同时,該算法使用互联网视频数据源进行跟踪器的训练和评估,从而逐步解决跟踪数据不足等问题。
Jul, 2017
本研究解决深度强化学习的一些问题,如模型推理泛化能力差和数据效率低。提出一种策略演员 - 评论家模型,以目标以及当前状态为函数,并在 AI2-THOR 框架下应用模型以与物体交互,实现在 3D 场景中进行大量样本高效收集,易于应用到现实场景并无需进行特征匹配。
Sep, 2016
本文提出了使用最新的强化学习算法进行端到端驾驶研究,仅使用来自前置摄像头的 RGB 图像,通过异步演员 - 评论家 (A3C) 框架在真实的赛车游戏中学习车辆控制,并在不同的道路结构、图形和物理特性下进行评估。结果表明本方法可以快速收敛和更稳健的驾驶,同时在看不见的赛道上和法定车速下进行了广义化证明。同时,我们的方法在实际影像序列上显示出一定的领域适应能力。
Jul, 2018
通过应用深度强化学习在工业 UR10e 机器人上的研究,我们发现近端策略优化比深度 Q 学习具有更好、更稳定的策略,而且使用更少的数据。
Aug, 2023