Aug, 2020

GRIMGEP: 视觉深度强化学习中鲁棒目标采样的进展学习

TL;DR提出了一种框架,可以使代理能够自主识别和忽略干扰区域,从而在可学习区域中寻找新颖性,改善整体表现并避免灾难性遗忘。实验表明,代理利用该框架成功地识别了环境的有趣区域,并在性能上取得了极大的改善。