Sep, 2022

基于自监督对抗模仿无标签混合动作的多用途技能控制

TL;DR本文提出了一种协作对抗式学习方法,用于从包含不同状态转移模式的未标记数据集中最大化它们的可辨识度,获得可控技能集的单一多才策略。实验结果表明,借助生成式对抗模仿学习框架中的无监督技能发现,出现了成功完成任务的新颖有用技能。最后,在名为 Solo 8 的敏捷四足机器人上测试了所获得的多才多艺策略,并呈现出编码在演示中的各种不同技能的忠实复制。