Jun, 2020

生态学强化学习

TL;DR本文讨论了针对非情节式、奖励稀疏的强化学习任务中的环境特性,如何应用“环境塑形”和“环境动态性”等方法来提升学习效果,并通过实验验证了这些方法的有效性。