深度强化学习目标检测
提出了一种用于在场景中定位目标物体的主动检测模型,该模型是类特定的,并允许代理集中注意力于识别目标物体的候选区域,通过深度强化学习训练定位代理,并在 Pascal VOC 2007 数据集上评估,结果表明,使用该模型指导的代理能够在分析图像中仅仅探测 11 到 25 个区域后定位一个物体实例,并且在不使用物体提议进行物体定位的系统中取得了最佳的检测结果。
Nov, 2015
本文提出了一种使用深度强化学习引导的层级目标检测方法,通过选择含有更多信息的图像部分并对其进行放大来不断迭代提高图像的分析效果,并比较了两种不同的候选对象建议策略,以指导对象搜索,实验表明,采用重叠的候选建议策略和为每个区域建议计算特征映射的第一种策略能够取得更好的结果。
Nov, 2016
为了减少使用高空间分辨率图像所带来的计算和货币成本,我们提出了一种强化学习代理,该代理自适应地选择提供给探测器的每个图像的空间分辨率,并使用双重奖励设置对代理进行训练,以选择低空间分辨率图像,以运行粗级探测器,同时选择高空间分辨率图像,则运行精细级探测器,该方法在维持与仅使用高分辨率图像的检测器相似的准确性的同时,将运行时间效率提高了 50%,只使用高分辨率图像 30%的时间
Dec, 2019
本文提出一种全面的端到端视频视觉跟踪方法,利用循环卷积神经网络代理与视频进行交互,并结合强化学习算法来学习不断的关注连续帧相关性和最大化在长期内的跟踪性能,实现了比现有跟踪基准更快速的状态 - of-the-art 性能。是第一个将卷积和循环网络与强化学习算法相结合的神经网络跟踪器。
Jan, 2017
本文提出了一种实用于实际机器人任务 -- 如机器人操作 -- 的深度强化学习算法,并在无人监督的情况下使用自我监督的基于模型的方法来训练预测模型,通过选择指定像素、目标图像或图像分类器作为目标设定方法,探索实现前所未见的任务和物体的普遍泛化。
Dec, 2018
本研究通过深度强化学习解决了目标跟踪和摄像头控制任务难以共同调整的问题,并在模拟器上训练的跟踪器表现出良好的泛化能力,且具备潜在的真实场景应用价值。
Aug, 2018
本研究采用深度强化学习的端到端方法,结合 ConvNet-LSTM 函数的预测能力,提出了一种针对活动物体追踪的解决方案,并通过环境增强技术和定制的奖励函数进行训练。结果表明,在模拟器中训练的跟踪器能够在未知的物体移动路径、外观、背景和干扰物的情况下表现良好。实验还表明,单独在模拟器中训练的跟踪能力具有潜在的适用性和推广性,可以在真实情况下进行。
May, 2017
介绍一种名为 ObjectRL 的算法,可以决定应当应用多少特定的图像预处理方法来提高预训练网络的目标检测性能,因为对于神经网络而言,人眼看来好的图像未必是最优的。
Aug, 2020