Apr, 2022

机器人多目标强化学习中基于回顾的指令实现

TL;DR本文提出使用机器人强化学习来学习自然语言目标表示的问题。通过提出回顾指令重播机制、seq2seq 模型和基于语言的学习任务,解决了自然语言的组合性和触觉数据和行为之间的联系问题,并展示了学习性能的提高。