Jul, 2018

模型基深度强化学习算法框架及其理论保证

TL;DR本文提出了一种新的算法框架来设计和分析具有理论保证的基于模型的强化学习算法,该框架将不确定性原则扩展到非线性动态模型,其中模型 SLBO 在连续控制基准任务上实现了最先进的性能。