NIPSJun, 2017

Dex: 深度强化学习复杂环境下的增量学习

TL;DR介绍了针对连续学习方法培训和评估的 DEX 强化学习环境工具包以及增量学习方法的巧妙应用,该方法可以通过从解决类似的较简单的环境中学习的最佳重量初始化来解决挑战性环境,并通过提供十种 DEX 环境的强大基线方法表明增量学习可以产生远远优于标准方法的结果,并最终开发了一种用于定性分析强化学习的显著性方法,展示了增量学习对网络注意力的影响。