ICMLJun, 2020

多智体强化学习中的随机实体分解

TL;DR本文介绍了一种名为 REFIL 的方法,能够在多个具有不同类型和数量的代理和非代理实体的任务中发现共性,从而提高多任务环境下的学习效率,并在挑战性的多任务 StarCraft 微管理环境中显著优于所有强基线。