Feb, 2022

从语言中学习可解释技能抽象的 LISA

TL;DR本文提出了一种可以从语言相关演示中学习多样、可解释的原始行为或技能的分层模仿学习框架 (LISA),采用向量量化方法来学习与语言指令高度相关的离散化技能编码,并在导航和机器人操作环境中实现了对未见过指令的方案的任务解决能力的提高,从而在序列决策制定中实现更自然地基于语言条件,以学习可以解释和可控的行为。