Aug, 2020
GRIMGEP: 视觉深度强化学习中鲁棒目标采样的进展学习
GRIMGEP: Learning Progress for Robust Goal Sampling in Visual Deep Reinforcement Learning
Grgur Kovač, Adrien Laversanne-Finot, Pierre-Yves Oudeyer
TL;DR提出了一种框架,可以使代理能够自主识别和忽略干扰区域,从而在可学习区域中寻找新颖性,改善整体表现并避免灾难性遗忘。实验表明,代理利用该框架成功地识别了环境的有趣区域,并在性能上取得了极大的改善。