BriefGPT.xyz
Ask
alpha
关键词
empirical rigor
搜索结果 - 1
评估深度强化学习中任务不完全规定的影响
本研究探讨如何更准确地评估深度强化学习方法在真实世界中的应用,并提出了考虑参数化 MDP 家族的方法。研究结果表明,在 MDP 家族上对 DRL 方法进行评估,相对于在用户选择的 MDP 实例上进行评估,往往可以得到不同的方法排名,这为强化
→
PDF
2 years ago
Prev
Next