Nov, 2020

鹦鹉:数据驱动的强化学习行为先验

TL;DR本论文提出了一种用于预训练行为先验的方法,以便捕捉先前看到的各种任务中观察到的复杂输入输出关系,并展示了如何使用这种学习到的先验以便快速学习新任务,有效地解决了具有挑战性的机器人操纵领域中的问题。