BriefGPT.xyz
Ask
alpha
关键词
exploration problems
搜索结果 - 2
应用内在动机技术于强化学习在难度较高的探索环境中的评估研究
本文旨在探讨强化学习中的探索问题以及先锋内在动机技术对不同设计因素的可变性和易感性的影响,强调这些设计方面的谨慎选择以及环境和任务的探索要求,以保证公正比较。
PDF
2 years ago
利用演示高效解决难度探索问题
介绍了 R2D3,这是一种代理程序,可有效利用演示来解决部分可观测环境下高度可变的难解探索问题。我们还介绍了一套结合这三个属性的八项任务,并展示了 R2D3 可以解决多项任务,在其他现有方法(无论是否使用演示)经过数十亿步探索后,仍无法看到
→
PDF
5 years ago
Prev
Next