Sep, 2023

H2O+: 混合离线和在线强化学习的改进框架与动态间隙

TL;DR通过模拟和实际机器人实验,我们展示了新算法H2O+在跨领域在线和离线强化学习算法方面的高性能和灵活性。