Apr, 2023

利用对称性和启发式演示的离线策略强化学习在机器人操纵中的应用

TL;DR本研究旨在定义和纳入物理机器人环境中的自然对称,利用行为克隆和强化学习相结合的方法,通过专家演示在对称环境下训练高效的模型无关强化学习策略,为普通操作任务的学习性能提供了新的可行方法。实验研究结果显示,相较于传统的策略外学习算法,该方法具有更好的学习性能和应用价值。