Feb, 2021

PerSim:基于个性化模拟器的异构智能体数据高效离线强化学习

TL;DR本文提出基于模型的离线强化学习方法 PerSim 来解决数据稀缺性问题,通过学习每个智能体的个性化模拟器来提高性能并同时学习个性化策略。