There has been a recent paradigm shift in robotics to data-driven learning
for planning and control. Due to large number of experiences required for
training, most of these approaches use a self-supervised paradi
本文提出了一种协作对抗式学习方法,用于从包含不同状态转移模式的未标记数据集中最大化它们的可辨识度,获得可控技能集的单一多才策略。实验结果表明,借助生成式对抗模仿学习框架中的无监督技能发现,出现了成功完成任务的新颖有用技能。最后,在名为 Solo 8 的敏捷四足机器人上测试了所获得的多才多艺策略,并呈现出编码在演示中的各种不同技能的忠实复制。
介绍了在存在对手的目标条件学习中,使用 DigitFlip 和 CLEVR-Play 两个新的目标条件环境,提出了用于目标条件学习的 EHER 和 CHER 两种算法,并评估了它们的性能,最终介绍了 IGOAL:一种新的目标条件学习框架。实验结果表明,将 IGOAL 与 EHER 相结合可以显著地超过现有方法,在对抗随机和能力对手时表现更好。