AAAIApr, 2019

Few-Shot Bayesian Imitation Learning with Logical Program Policies

TL;DR提出了一种表达逻辑组合方案的策略学习算法,该算法可以从少量样本中学习有趣的策略,具备较高的数据效率和计算效率,适用于训练数据稀缺且存在结构差异较大的任务。