Sep, 2021

面向多任务离线强化学习的保守数据共享

TL;DR介绍了多任务离线强化学习中数据共享中所面对的分布移位与性能问题,并提出了一种保守数据共享的方法,应用于单任务离线强化学习,取得了在多项挑战性多任务机器人控制问题中最佳或相当的性能。