Jun, 2020

基于能量分布匹配的严格批量模仿学习

TL;DR该论文提出了一种通过进行基于演示行为的学习,以在完全离线的模式下执行严格批量模仿学习。