ICMLApr, 2023

一种耦合流方法的模仿学习

TL;DR本文介绍了利用基于正态流的模型对状态分布进行估计的应用,该算法针对单个专家轨迹,在许多基准任务上都取得了最先进的表现,并自然地扩展到各种其他设置,包括子采样和仅状态制度。