ICMLFeb, 2021

LTL2Action:将 LTL 指令泛化到多任务 RL 中

TL;DR本论文研究了在多任务环境下,通过使用线性时间逻辑(LTL),结合深度强化学习(RL)实现对代理人进行指令跟随的教学。为了提高效率,论文提出了一种与特定环境无关的 LTL 预训练方案,并在离散及连续领域实验中展示了该方法的优越性。