BriefGPT.xyz
Ask
alpha
关键词
neural network instabilities
搜索结果 - 1
NIPS
如何折扣深度强化学习:走向新的动态策略
本文研究使用深度神经网络作为函数逼近器来解决逼近真实世界复杂度的强化学习问题。同时,我们探讨了折扣因子在深度 Q 网络(DQN)学习过程中所起的作用,实验结果表明在逐渐增加折扣因子值的情况下,可以显著降低 DQN 学习步骤的数量。当与变动的
→
PDF
9 years ago
Prev
Next