ICLRDec, 2019

强化学习中的观测过拟合

TL;DR本研究提供了一个分析模型自由的强化学习中可能出现过度拟合的情形的框架,我们对观测空间进行修改以设计多个综合性的基准测试,并通过实验展示了与隐式规范和泛化性之间的关联