喊叫您的机器人：从语言纠正中实时改进

Mar, 2024

喊叫您的机器人：从语言纠正中实时改进

Yell At Your Robot: Improving On-the-Fly from Language Corrections

Lucy Xiaoyang Shi, Zheyuan Hu, Tony Z. Zhao, Archit Sharma, Karl Pertsch...

TL;DR通过语言反馈不断改进高层策略，使机器人在复杂的、需要长程规划的任务中表现得更加出色，无需额外的远程操作。

Abstract

hierarchical policies that combine language and low-level control have been shown to perform impressively long-horizon robotic tasks, by leveraging either zero-shot high-level planners like pretrained language and vision-language models (LLMs/VLMs) or models trained on annotated roboti

hierarchical policies long-horizon tasks language feedback high-level policies dexterous manipulation tasks

发现论文，激发创造

用自然语言反馈纠正机器人计划

本文探讨了将自然语言应用于机器人校正的方式，阐述了从自然语言句子到代价函数变换的映射方法，以及该方法如何通过多种方式对机器人进行校正，进而解决规划任务失败的问题，该方法已在模拟环境和真实环境中得到了验证。

Apr, 2022

使用语言的交互式分层指导

使用语言命令实现上下层结构分离的强化学习方法，在长期规划任务中能够有效提高任务样本效率并保持可解释性和人工干预能力。

Oct, 2021

交互式机器人从口头纠正学习

我们设计了一种基于大型语言模型 (LLM) 的学习系统 OLAF，使得普通用户可以通过语音纠正教导机器人，从而更新机器人的视觉运动神经策略，以避免未来重复错误，并在实验中展示了在长期任务执行中的成功率平均提高了 20.0%。

Oct, 2023

基于基础模型的人机协同持续机器人学习

通过使用基于大型语言模型的规划器，我们克服了当前固定技能集的限制，提出了一种用于数据和时间高效教授机器人这些技能的方法，该系统可以重复使用新习得的技能，展示了开放世界和终身学习的潜力。

Sep, 2023

Plan-Seq-Learn: 语言模型引导强化学习解决长时程机器人任务

利用大型语言模型（LLMs）和运动规划，提出了一种模块化方法 Plan-Seq-Learn（PSL），将抽象语言和学习到的低级控制相结合，从头开始解决长期目标的机器人任务，并在超过 25 个具有挑战性的机器人任务中取得了最先进的结果。

May, 2024

通过语言修正提炼和检索机器人操作的泛化知识

通过 Distillation and Retrieval of Online Corrections (DROC) 这个基于大型语言模型（LLM）的系统，我们展示了一种能够回应任意形式的语言反馈、从纠正中提取通用知识以及基于文本和视觉相似性检索相关的先前经验来提高在新环境中表现的方法。DROC 能够回应一系列在线语言纠正，解决高级任务计划和低级技能元素的失败，并证明在新的任务或对象实例中，DROC 能够有效地提取在线纠正序列中的相关信息并检索该知识。与直接生成机器人代码的 LLM 相比，DROC 只需要一半的纠正次数，并且在两轮迭代后几乎不需要纠正，从而提升了性能。

Nov, 2023

RT-H: 使用语言的动作层次结构

通过使用语言动作，桥接任务和动作，实现从人类介入中学习的灵活策略，并展示了这些策略在多任务数据集上的鲁棒性和灵活性。

Mar, 2024

精确高效地解读不同粒度的人机指令

本研究通过将命令与层级规划框架中所有可用的任务或子任务联系起来，实现了一种能够在多个抽象层级上解释语言的模型。该方法提高了命令的准确性和机器人的响应速度，使机器人可以高效地在不同的任务抽象层次上进行规划。

Apr, 2017

自然语言作为策略：利用 LLMs 进行坐标级体验控制的推理

我们展示了使用 LLMs 解决机器人动作规划问题的实验结果。与其它方法不同，我们的方法通过自然语言推理获取任务和场景对象的文本描述，并输出坐标级控制命令，从而减少中间表示代码作为策略的必要性。我们的方法在多模态提示仿真基准上进行评估，证明了自然语言推理改善成功率的潜力，并展示了利用自然语言描述将机器人技能从已知任务转移到以前未见任务的可能性。

Mar, 2024

通过人机协作增强基于 LLM 的机器人操控

通过人机协作的方式，本文提出了一种增强基于大型语言模型的自主操作的方法，并应用于机器人的高级语言指令解析、运动规划和理解环境。在与人类的互动过程中，通过结合远程操作和动态运动原理实现机器人从人类引导中学习。通过实验表明，在复杂轨迹规划和环境推理方面，基于大型语言模型的机器人通过融入人类示范可以高效地完成任务。

Jun, 2024