将语言与取放物任务结合

Feb, 2021

Composing Pick-and-Place Tasks By Grounding Language

Oier Mees, Wolfram Burgard

TL;DR本研究提出了一种基于自然语言指令的机器人系统，通过对话解决歧义，推断出物体及其关系，能够按照用户表达的空间关系成功地放置物体，具有较好的放置效果。

Abstract

Controlling robots to perform tasks via natural language is one of the most challenging topics in human-robot interaction. In this work, we present a robot system that follows unconstrained language instructions to pick and place arbitrary objects and effectively resolves ambiguities through

robot system natural language instructions object placement grounding dialogues

发现论文，激发创造

使用自由口语指令进行实际物品交互选择

本篇论文提出了一个通过深度学习技术处理自然语言和解决口语指令歧义的综合系统，旨在帮助机器人进行有效的人机交互，研究结果表明，通过建立对话式交互模型，机器人能够有效地理解和执行人类自然语言指令，并提高物体拾取任务的成功率。

Oct, 2017

通过人机对话改善基于场景的自然语言理解

该论文介绍了一种将自然语言命令翻译成离散机器人动作的方法，并使用澄清对话共同改进语言解析和概念基础。将这个代理程序训练和评估在亚马逊的 Mechanical Turk 平台上的虚拟环境，并在真实环境中将学习到的代理迁移到物理机器人平台进行演示。

Mar, 2019

以行动示范为导向，而非口头指示：将自然语言融入机器人可用性

利用预训练技能约束自然语言模型以便进行真实世界的物理执行，从而实现语言驱动机器人。

Apr, 2022

自然语言机器人编程：将自然语言处理与自主机器人抓取集成

本文提出了一种基于语法的自然语言机器人编程框架，特别用于拾取和放置任务，其方法使用自定义的动作词词典来存储共享意义的单词，通过增加更多的动作词从词汇数据库，轻松扩展词汇量。本文通过模拟和现实世界的实验验证了我们的自然语言机器人编程（NLRP）框架，使用配备了校准相机和麦克风的 Franka Panda 机器人手臂，并将参与者要求使用口头命令完成拾取和放置任务，该任务经由 Google 的语音转文本 API 转换为文本并通过 NLRP 框架处理，以获取机器人的联合空间轨迹，该方法具有高的系统可用性得分，可以轻松扩展字典而不依赖于转移学习或大型数据集，未来我们计划通过综合用户研究比较所述框架与不同人类辅助拾取和放置任务的方法

Apr, 2023

面向语言驱动空间布局的物体中心推断：一种基于基础模型的方法

我们提出了一种对象为中心的框架，利用基础模型来对参考对象和空间关系进行基础建模，使得机器人可以生成满足语言指令中所有空间关系限制的放置位置，该模型可提高训练数据的利用效率并具有更强的泛化性能，在只有 25% 的训练数据下，我们的模型仍然表现优于目前最佳方法，且可以达到 97.75% 的放置成功率。

Apr, 2023

无需物体模型的自监督学习精准拾取和放置

该研究提出一种应用基于机器学习的灵活取放技术实现对物体的自主操作方法，通过学习与仿真操作降低了对于物体模型的需求。

Jun, 2020

SPOTS: 半自主遥操作系统中稳定物体放置与推理

在本文中，我们研究了机器人技术中的一个基本任务 —— 拾取和放置。通过结合仿真驱动的物理稳定性验证和大型语言模型的语义推理能力，我们提出的方法能够在给定上下文信息的情况下，输出放置任务的可能候选位置的概率分布，考虑到任务的稳定性和合理性。我们在两个仿真环境和一个真实环境中对我们的方法进行了广泛评估，并展示了我们的方法在考虑用户偏好的情况下，显著提高了放置任务的物理可信度和上下文合理性。

Sep, 2023

三维物体语言基础

本文介绍了一个新的推理任务，旨在针对三维对象的视觉和非视觉语言，并介绍了用于区分对象的几种 CLIP 模型。虽然最近在联合建模视觉和语言方面取得了进展，但这些基于图像的模型仍然对对象的三维性质了解不足，此文发现，将视图估计添加到语言引理模型可以提高准确性。

Jul, 2021

铺路把握一切：将基础模型转移，用于通用拾放机器人

本文提出了一种基于语言根据分割掩模的新型范例，来应对日常情况下一系列的抓取和放置机器人操作任务，通过将从掩模中传达的精确语义和几何形状与我们的多视点策略模型相结合，使我们的方法能够感知准确的物体姿态并实现样本高效学习。

Jun, 2023

精确高效地解读不同粒度的人机指令

本研究通过将命令与层级规划框架中所有可用的任务或子任务联系起来，实现了一种能够在多个抽象层级上解释语言的模型。该方法提高了命令的准确性和机器人的响应速度，使机器人可以高效地在不同的任务抽象层次上进行规划。

Apr, 2017