Jun, 2023

来自不同人类监管者的隐式交互式车队学习

TL;DR本文提出了解决 Interactive Fleet Learning (分布转移) 和 Implicit Behavior Cloning (多模态) 问题的 Implicit Interactive Fleet Learning 方法,并通过模拟实验和物理实验表明其在人类辅助下具有更高的执行成功率和更高的回报。