为了减少使用高空间分辨率图像所带来的计算和货币成本,我们提出了一种强化学习代理,该代理自适应地选择提供给探测器的每个图像的空间分辨率,并使用双重奖励设置对代理进行训练,以选择低空间分辨率图像,以运行粗级探测器,同时选择高空间分辨率图像,则运行精细级探测器,该方法在维持与仅使用高分辨率图像的检测器相似的准确性的同时,将运行时间效率提高了 50%,只使用高分辨率图像 30%的时间
Dec, 2019
采用强化学习方法进行对象检测,采用预定义区域候选树、缩放操作和优化奖励函数等技术手段,实现更精准的物体边框配置。
Oct, 2018
本文介绍了一种基于深度强化学习的主动目标定位算法,比较了两种不同的决策过程方法:分层方法和动态方法,并进一步通过调整不同的超参数和架构变化对模型性能进行了消融研究。
Aug, 2022
本文提出一种全面的端到端视频视觉跟踪方法,利用循环卷积神经网络代理与视频进行交互,并结合强化学习算法来学习不断的关注连续帧相关性和最大化在长期内的跟踪性能,实现了比现有跟踪基准更快速的状态 - of-the-art 性能。是第一个将卷积和循环网络与强化学习算法相结合的神经网络跟踪器。
Jan, 2017
本文通过实验探究并系统评估 OCR 预训练对于基于图像的强化学习原型任务的影响及其局限性,研究结果为在某些情况下 OCR 预训练使用的潜在局限性提供了实证证据,并分析了影响 OCR 预训练在强化学习中应用的关键因素,包括在视觉复杂环境中的性能和适当的汇聚层以聚合对象表示。
Feb, 2023
这项研究提出了一种适用于表示多个物体及其相互作用的可视强化学习结构化方法,用于学习多个物体的目标条件操纵,并演示了学习使用三个物体但能推广到具有十多个物体的类似任务的代理的能力。
Apr, 2024
该研究提出了一种新方法,可以将物体识别处理引入深度强化学习模型,提供了一种新方法来解释深度强化学习智能体的行动,并在 Atari 游戏方面取得了最先进的结果。
Sep, 2018
本论文提出了一种低维观察过滤器,使深度 Q 网络代理能够在视觉复杂的现代视频游戏(Neon Drive)中成功玩耍。
Apr, 2022
本文提出了一种使用深度强化学习引导的层级目标检测方法,通过选择含有更多信息的图像部分并对其进行放大来不断迭代提高图像的分析效果,并比较了两种不同的候选对象建议策略,以指导对象搜索,实验表明,采用重叠的候选建议策略和为每个区域建议计算特征映射的第一种策略能够取得更好的结果。
Nov, 2016
通过利用人类反馈进行强化学习,无监督对象发现的准确性和训练速度得到了显著提高。
Oct, 2023