ICLRFeb, 2022

重新思考目标导向式监督学习及其与离线强化学习的关联

TL;DR本文提出了一种名为 Weighted GCSL 的离线目标导向强化学习算法,通过引入高级复合权重,优化目标达成的下界限,具有优异的性能表现,特别适用于点和模拟机器人方面。