LLM-Personalize: 通过强化自我训练使 LLM 规划器与人类偏好保持一致的家务机器人

Apr, 2024

LLM-Personalize: 通过强化自我训练使 LLM 规划器与人类偏好保持一致的家务机器人

LLM-Personalize: Aligning LLM Planners with Human Preferences via Reinforced Self-Training for Housekeeping Robots

Dongge Han, Trevor McInroe, Adam Jelley, Stefano V. Albrecht, Peter Bell...

TL;DR通过优化流程，个性化 LLM 规划器以适应个体用户偏好，大幅提高与人类偏好的一致性。

Abstract

large language models (LLMs) have shown significant potential for robotics applications, particularly task planning, by harnessing their language comprehension and text generation capabilities. However, in applic

large language models llm-personalize personalization household robotics task planning

发现论文，激发创造

基于基础模型的人机协同持续机器人学习

通过使用基于大型语言模型的规划器，我们克服了当前固定技能集的限制，提出了一种用于数据和时间高效教授机器人这些技能的方法，该系统可以重复使用新习得的技能，展示了开放世界和终身学习的潜力。

Sep, 2023

部分可观察机器人任务的大型语言模型交互规划

使用大型语言模型（LLMs）的互动规划技术，通过机器人收集环境中缺失的信息并推断底层问题的状态，从而指导机器人执行所需的动作。

Dec, 2023

VoicePilot: 利用语言模型作为机器人辅助的语音界面

通过结合大规模语言模型作为语音界面，我们提出了一个框架，用于将大规模语言模型应用于物理辅助机器人，以实现高水平任务规划和代码生成，并通过实证研究为物理辅助机器人的语音界面设计提供指导。

Apr, 2024

SRLM：基于大型语言模型和深度强化学习的人机交互社交机器人导航

我们提出了一种新的混合方法，称为社交机器人规划器 (SRLM)，它将大型语言模型 (LLM) 和深度强化学习 (DRL) 相结合，以在人满为患的公共场所为人们提供多种社交服务。SRLM 通过实时人类指令推断全局规划，并将社交信息编码到基于 LLM 的大型导航模型 (LNM) 中进行低层运动执行。此外，设计了一种基于 DRL 的规划器来保持基准性能，通过大型反馈模型 (LFM) 与 LNM 融合，以解决当前文本和 LLM 驱动的 LNM 的不稳定性。最后，SRLM 在广泛的实验证明表现出色。

Mar, 2024

LLM-Planner: 借助大型语言模型进行少样本基于实例的具身 agent 规划

本研究使用大型语言模型 (Large Language Models, LLMs) 作为规划师，以完成视觉感知环境中的复杂任务的具有身体接口的代理人。研究提出了 LLM-Planner 方法进行 few-shot planning，同时提出通过物理接口增强 LLMs 的简单而有效的方法，实验结果表明该方法在 ALFRED 数据集上能够取得与使用全数据训练的基线模型相当的性能。

Dec, 2022

以人为中心的规划

创建基于 LLMs 的规划器（LLMPlan）与能够将文本约束转化为符号表示的符号规划器（SymPlan），通过自我反思的能力以及对自然语言中模糊约束的合并，LLM 基于规划器在 40 名用户的互动评估中表现出优异的用户满意度（70.5%）且不输于传统符号规划器（40.4%）的显式约束满足率。

Nov, 2023

LLM A*：人在循环大型语言模型启用的 A * 搜索用于机器人技术

研究聚焦于大型语言模型如何以人机交互的方式帮助移动体代理（如机器人）的路径规划。提出了名为 LLM A * 的创新框架，旨在利用 LLM 的常识，采用效用最优的 A * 算法来实现少样本近最优路径规划。通过引导 LLM 以求解 ` 白盒 ' 的路径规划过程，并将人类反馈作为引导，相较于基于强化学习的规划方法，如 RL，使得无需编码的路径规划变得实用，并且推广了人工智能技术的包容性。与 A * 和 RL 的对比分析表明，LLM A * 在搜索空间方面更高效，能达到与 A * 相当的路径并优于 RL。LLM A * 的交互性还使其成为协作人机任务部署中具有潜力的工具。

Dec, 2023

基于 LLM 的人机协作框架用于操作任务

该论文介绍了一种利用大型语言模型（LLM）进行自主机器人操纵的新方法，通过逻辑推理将高层语言命令转化为可执行的运动函数序列。所提出的系统将 LLM 的优势与基于 YOLO 的环境感知相结合，使机器人能够根据给定的命令自主做出合理的决策和任务规划。此外，为了解决 LLM 可能出现的不准确性或不合逻辑的行为，采用了远程操作和动态运动原理（DMP）的组合进行行为校正。这种融合旨在提高 LLM 基础的人机协作系统的实用性和通用性。

Aug, 2023

作为零样本人类模型的大型语言模型用于人机交互

本文探索了使用大型语言模型作为 HRI 的 0 模型的潜力，并在三个社交数据集上进行了实验，结果显示 LLMs 能够实现与定制模型相当的性能，同时还讨论了当前的限制。基于我们的发现，我们展示了 LLM 人类模型如何集成到社交机器人的规划过程中并应用于 HRI 场景。我们的结果表明 LLMs 为 HRI 的人类建模提供了一种有前途但不完整的方法。

Mar, 2023

TidyBot：基于大型语言模型的个性化机器人助手

本研究着眼于探究如何通过先前与特定人的互动，从少量样例中学习用户偏好以个性化地协助家务清理，并通过大型语言模型（LLM）的 few-shot summarization 能力进行推断，融合基于语言的计划和感知，以便在未来的交互中普遍适用。

May, 2023