NIPSJun, 2018

利用无模型 Q 集成和基于模型方法相结合进行知情探索

TL;DR本论文提出将模型自由的 Q-Ensembles 和基于模型的方法相结合,以期望增强其探索能力。结果表明,当基于轨迹记忆的模型与 Q-Ensembles 方法相结合时,可以得到比仅使用 Q-Ensembles 方法更优越的性能。