从语言中学习可解释技能抽象的 LISA

Feb, 2022

从语言中学习可解释技能抽象的 LISA

LISA: Learning Interpretable Skill Abstractions from Language

Divyansh Garg, Skanda Vaidyanath, Kuno Kim, Jiaming Song, Stefano Ermon

TL;DR本文提出了一种可以从语言相关演示中学习多样、可解释的原始行为或技能的分层模仿学习框架 (LISA)，采用向量量化方法来学习与语言指令高度相关的离散化技能编码，并在导航和机器人操作环境中实现了对未见过指令的方案的任务解决能力的提高，从而在序列决策制定中实现更自然地基于语言条件，以学习可以解释和可控的行为。

Abstract

Learning policies that effectively utilize language instructions in complex, multi-task environments is an important problem in sequential decision-making. While it is possible to condition on the entire language

language instructions sequential decision-making hierarchical imitation learning framework vector quantization interpretable skill abstractions

发现论文，激发创造

关于基于语言条件技能发现的互信息思考与模仿学习

通过数学方法评估语言条件化策略学习框架中技能与语言指令之间的关系，提出了一种称为语言条件化技能发现（LCSD）的端到端模仿学习方法，通过最大化语言和技能之间的互信息，在无监督的情况下学习离散潜在技能并利用技能序列重构高级语义指令，通过在 BabyAI、LORel 和 CALVIN 上进行大量实验，展示了我们方法在语言条件化的机器人导航和操作任务中的优越性，包括对未知任务的增强泛化能力、改进的技能可解释性和显著提高的任务完成成功率。

Feb, 2024

ELLA: 通过学习语言抽象进行探索

ELLA 是一种基于奖励塑形的方法，在语言指令与简单低级组成件之间建立相关性，以提高稀疏奖励环境下机器人智能体的样本效率。

Mar, 2021

通过元学习用语言指导政策

本文提出了一种交互式的任务规范问题形式，通过自然语言指令和一系列语言修正来引导自主代理获得新技能，实现快速获取新技能，显著优于直接非交互式指令跟随。

Nov, 2018

用语言导向的时间变分推断进行技能学习

我们提出了一种从专家示范中发现技能的算法，该算法首先利用大型语言模型对轨迹进行初步分割，然后采用层次变分推理框架结合语言模型生成的分割信息，通过合并轨迹段来发现可重用的技能。为了进一步控制压缩和可重用性之间的权衡，我们引入了一种基于最小描述长度原则的新辅助目标，有助于指导这一技能发现过程。我们的结果表明，使用我们的方法装备的代理能够发现有助于加速学习的技能，并在 BabyAI（一个网格世界导航环境）以及 ALFRED（一个家庭仿真环境）的新长期任务中胜过基线技能学习方法。

Feb, 2024

利用语言学习程序抽象和搜索启发

该论文介绍了一种名为 LAPS 的技术，它使用自然语言注释来引导库和神经引导搜索模型的联合学习，以实现程序的归纳合成。与一些自然语言注释不可用的测试时间相比，LAPS 可生产高质量的程序库并提高搜索效率和泛化性。

Jun, 2021

基于语言引导的状态抽象学习

使用自然语言设计状态抽象来实现模仿学习的框架，该框架利用语言模型的背景知识和自然语言监督，自动构建针对未见任务的状态表示，并证明其提高了泛化性和稳健性，缩短了设计时间。

Feb, 2024

加入技能发现

语言驱动的机器人技能研究中，通过利用大规模语言模型的高级推理能力应用于低级机器人控制，继续面临的挑战是获取多样化的基础技能。本研究介绍了一种完全由语言模型驱动的技能发现框架，通过提供的场景描述和机器人配置生成任务提案，并逐步获得新的技能来完成任务，使用强化学习过程以及独立的视觉 - 语言模型确保学到的行为的可靠性和可信度，从而使机器人能够高效地提出和完成高级任务。

May, 2024

语言条件下的机器人操作任务模仿学习

这篇研究论文介绍了一种将自然语言引入模仿学习中的方法，可以让专家在提供动作演示的同时，提供自然语言的描述。通过融合语言、知觉和动作的关系，实现了更加精细的控制，降低了场景的模糊度。在七自由度机械臂控制任务上的模拟实验表明，此方法可有效学习自然语言条件下的机器人操作策略，并与其他方法相比做出了明显改进。

Oct, 2020

社会可解释性强化学习

基于社会学习原理的 Social Interpretable RL (SIRL) 是一种改善学习效率的新型基于人口的方法，通过模拟社会学习过程使每个群体中的智能体基于自身的个体经验和与同伴的共同经验来解决给定任务，实现了在高风险场景中解释能力关键的强化学习应用。

Jan, 2024

符号化模仿学习：从黑盒到可解释的驾驶策略

当前的模仿学习方法在实现高效的驾驶策略从真实世界数据中获益，但在可解释性和泛化性方面存在显著限制。本文通过引入符号模仿学习（SIL）来解决这些限制，它利用归纳逻辑编程（ILP）来学习透明、可解释和泛化的驾驶策略。使用 real-world highD 数据集，我们对 SIL 方法进行了严格的比较分析，结果表明 SIL 不仅提高了驾驶策略的可解释性，而且在各种驾驶情况下显著提高了它们的适用性。因此，本研究为更可靠和更安全的自动驾驶系统提供了一条新途径，强调了将 ILP 整合到 IL 领域的潜力。

Sep, 2023