CVPRApr, 2021

强化学习的无监督视觉注意力与不变性

TL;DR本研究提出了一种基于视觉前景的增强学习 (domain generalization) 方法,可以将环境中的干扰 (视觉噪声) 最小化,从而使得强化学习效果更佳。该方法基于无监督学习,使用关键点检测和视觉注意力机制进行前景提取并获得干净且不变的视觉输入。实验证明,该方法在 DeepMind 的控制任务中表现优于最新的基于视觉域的通用 (reinforcement learning) 方法。