BriefGPT.xyz
Ask
alpha
关键词
policy search methods
搜索结果 - 2
集体机器人分布式异步引导策略搜索强化学习
本文探讨了分布式异步策略学习作为实现机器人具备普适性和提高复杂任务训练效率的手段。实验证明,使用这种方法可以提高机器人对任务的泛化、利用和训练时间效率,从而在视觉门开启任务中取得更好的效果。
PDF
8 years ago
通过策略搜索学习合作
本文提出了一种基于梯度的分布式策略搜索方法,用于合作博弈中的部分可观测环境,比较了本地最优和纳什均衡的概念,实验结果表明该方法的有效性。
PDF
10 years ago
Prev
Next