Dec, 2018

模型驱动的强化学习中规划器过拟合问题的缓解

TL;DR探索一种中间立场,通过对其考虑的计划进行一种正则化来避免过度拟合,该论文提出了三种不同的方法,可在强化学习环境下明显缓解计划器过度拟合。