Jul, 2023

离线多智能体强化学习中的隐式全局局部价值规范化

TL;DROMIGA 是一种新的离线多智能体强化学习算法,具有隐式的全局到局部值正则化,能够在实例学习中同时实现多智能体值分解和离线正则化的策略学习,通过在离线多智能体任务中的全面实验表明,OMIGA 在几乎所有任务中表现优于最先进的离线多智能体强化学习方法。