Mar, 2017

探索性示例模型用于深度强化学习

TL;DR本文提出了一种基于判别式训练范例模型的探索性新颖性检测算法,该算法可以应用于稀疏回报问题的深度强化学习任务,此方法在 vizDoom 基准测试中取得了最先进的结果。