AAAIOct, 2021

使用语言的交互式分层指导

TL;DR使用语言命令实现上下层结构分离的强化学习方法,在长期规划任务中能够有效提高任务样本效率并保持可解释性和人工干预能力。