Feb, 2023

组合动作空间中的高效规划及其在合作多智能体强化学习中的应用

TL;DR本篇研究论文是关于如何在具有组合行动空间的多智能体强化学习中,通过访问 argmax oracle 并建立在线模拟和线性函数逼近的最小要求,提出了一种高效的算法,以在所有相关问题参数的多项式计算和查询复杂度内实现计划。