AAAIApr, 2019
Few-Shot Bayesian Imitation Learning with Logical Program Policies
Few-Shot Bayesian Imitation Learning with Logical Program Policies
Tom Silver, Kelsey R. Allen, Alex K. Lew, Leslie Pack Kaelbling, Josh Tenenbaum
TL;DR提出了一种表达逻辑组合方案的策略学习算法,该算法可以从少量样本中学习有趣的策略,具备较高的数据效率和计算效率,适用于训练数据稀缺且存在结构差异较大的任务。