AAAIMar, 2022

即使学习最弱的学习者,我们也能学到什么?—— 为编程策略学习草图

TL;DR使用行为克隆进行草图学习可帮助合成程序化策略,与传统方法相比,我们的综合器可以生成优于传统方法和最新竞争方法的策略。