Feb, 2021
PerSim:基于个性化模拟器的异构智能体数据高效离线强化学习
PerSim: Data-Efficient Offline Reinforcement Learning with Heterogeneous Agents via Personalized Simulators
Anish Agarwal, Abdullah Alomar, Varkey Alumootil, Devavrat Shah, Dennis Shen...
TL;DR本文提出基于模型的离线强化学习方法 PerSim 来解决数据稀缺性问题,通过学习每个智能体的个性化模拟器来提高性能并同时学习个性化策略。