Jan, 2023

异步多智能体强化学习用于高效实时多机器人协同探索

TL;DR我们提出了一种异步的多智能体强化学习算法,Asynchronous Coordination Explorer (ACE),可以在处理机器人探索问题时减少实际探索时间,并通过使用基于 CNN 的策略将遗失的机器人维护在一个团队中。