Jun, 2022

基于视觉观测的离线强化学习中的挑战与机遇

TL;DR本文旨在建立连续控制的视觉基线,通过离线强化学习从视角上建立简单的基线,并在数据集中严格评估算法,同时分析了离线视角下的重要的特殊需求。