Jun, 2021

使用继承表示的深度强化学习方法实现边缘化重要性采样

TL;DR本文介绍了一种基于successor representation的边际重要性抽样 (MIS) 方法,与当前最先进的MIS方法相比,该方法减少了优化难度并具有普适性。作者在Atari和MuJoCo等挑战性环境中进行了实验性能评估。