Dec, 2023

通过自动课程学习的多智能体追逐任务求解器

TL;DR本研究介绍了一种结合强化学习和课程学习的灵活求解器(TaskFlex Solver,TFS),能够在二维和三维场景中解决具有多样和动态任务条件的多智能体追捕问题,通过构建基于训练进展的任务分布来提高训练效率和最终性能。实验表明,TFS 在不同场景中的多智能体追捕问题中比基线模型表现更强,并且能够实现接近 100% 的捕获率。