Mar, 2022

离线强化学习综述:分类、评估与开放性问题

TL;DR本论文提出一个在线学习和离线学习技术的归一化分类法,总结了离线 RL 领域的最新算法突破和现有基准的特性和不足,并提供了对未来研究方向的展望。