Jun, 2023

从次优演示中进行模仿学习的技能解耦

TL;DR本文提出了一种可以从小的干净数据集和大的嘈杂数据集中学习到子最优示范的深度递归网络,通过技能探索和调整,以及相互信息正则化促进技能空间中的解缠缩。