Nov, 2023

线性行为克隆智能体的最佳教学

TL;DR我们研究了Linear Behavior Cloning(LBC)学习者的最佳教学方法。我们提出了一种名为“Teach using Iterative Elimination(TIE)”的教学算法,它实现了最佳的教学维度。然而,我们也证明了寻找最佳教学集是NP难问题,因此我们提供了一个近似算法保证了教学维度的近似比为log(|A|-1)。最后,我们提供了实验结果来验证我们算法的效率和效果。