May, 2023

连续离线强化学习的离线经验回放

TL;DR本文提出基于模型的经验选择方案以解决离线强化学习中的经验回放问题和遗忘问题,并进行了实验验证。