BriefGPT.xyz
Ask
alpha
关键词
coinrun
搜索结果 - 1
量化强化学习的泛化能力
本文研究了深度强化学习中的过拟合问题,并使用程序生成的环境来构建不同的训练和测试集,其中引入了一个名为 CoinRun 的新环境,用作强化学习中泛化的基准。使用 CoinRun,作者发现代理程序会对相当大的训练集过拟合,还展示了更深层次的卷
→
PDF
6 years ago
Prev
Next