ICMLDec, 2017

强化学习中的时间限制

TL;DR本文探讨了如何在有限时间内训练强化学习(reinforcement learning)代理,以及如何通过将时间限制整合到算法中来提高性能和稳定性,在控制任务(control tasks)方面取得了最新的成果。