BriefGPT.xyz
Ask
alpha
关键词
provably efficient randomized exploration
搜索结果 - 1
合作多智体强化学习中的随机探索
我们提出了第一个关于合作多智能体强化学习(MARL)中可证明效率的随机探索的研究,提出了一种统一的随机探索算法框架,以及两种基于 Thompson Sampling(TS)的算法。我们在多个并行强化学习环境中评估了我们的方法,包括深度探索问
→
PDF
3 months ago
Prev
Next