Oct, 2022

基于蒸馏执行的个性化多智体强化学习训练

TL;DR本文提出了一种新的多智能体强化学习范式 (PTDE) ,通过对全局信息进行个性化设置,将个体的全局信息提炼成本地信息,用于分权执行,实现更好的性能,其可与现有的算法结合使用,提高性能。