互动就是你所需要的？关于机器人理解和执行能力的研究

Nov, 2023

互动就是你所需要的？关于机器人理解和执行能力的研究

Interaction is all You Need? A Study of Robots Ability to Understand and Execute

Kushal Koshti, Nidhir Bhavsar

TL;DR该研究旨在探索将机器人与人类环境进行自然语言交互以实现无缝操作的关键挑战，通过使用多变压器模型和 BART 语言模型，我们在执行对话历史任务上取得了显著的改进，并提出了一种新的任务扩展方法通过预测游戏计划来促进任务解决。

Abstract

This paper aims to address a critical challenge in robotics, which is enabling them to operate seamlessly in human environments through natural language interactions. Our primary focus is to equip robots with the ability to understand and execute →

robotics natural language interactions complex instructions multi-transformer model game plans

发现论文，激发创造

任务驱动的具有体感的对话智能体（TEACh）

引入 TEACh 数据集，通过三个基准测试，研究基于人类空间的机器人必须能够与人进行自然语言交互，理解和执行指令，使用会话来解决模糊性并从错误中恢复的具体挑战。

Oct, 2021

面向机器人操作的指导驱动历史感知策略

本研究提出了一种基于 Transformer 的方法来处理人类语言指令和多视角场景观察，以提高机器人的精准操作，并在 RLBench 基准测试中成功实现 74 项任务，还表现出对未曾见过变化的任务的良好泛化性能。

Sep, 2022

通过人机对话改善基于场景的自然语言理解

该论文介绍了一种将自然语言命令翻译成离散机器人动作的方法，并使用澄清对话共同改进语言解析和概念基础。将这个代理程序训练和评估在亚马逊的 Mechanical Turk 平台上的虚拟环境，并在真实环境中将学习到的代理迁移到物理机器人平台进行演示。

Mar, 2019

实时对话机器人的交互语言

该研究提出了一个框架，用于在现实世界中建立交互式、实时的、自然语言指导的机器人，并开源相关资产 (数据集、环境、基准和策略)。

Oct, 2022

语言模型与交互式任务规划

一个互动机器人框架可以完成长期任务规划，并能在执行过程中轻松推广到新目标或不同任务。通过语言模型实现了高级规划和低级功能执行的系统，实现了对未知目标的新颖高级指令的生成，并通过仅替换任务指南来适应不同任务，而无需复杂的提示工程。此外，当用户发送新请求时，系统能够根据新请求、任务指南和先前执行步骤精确地重新规划。

Oct, 2023

上下文中理解自然语言

本文旨在研究自然语言交互与认知机器人、知识表达形式、计划工具和翻译过程的结合应用，以提高其在日常生活中的任务完成效率。

May, 2022

利用建议提高机器人的自然语言交互

本研究通过提出一个包含建议的协议来增加物理基础语言理解任务的交互带宽，并在块世界任务上评估了该方法的有效性，发现简单的建议可以显著提高任务性能，同时也探讨了模型自动生成建议以减少提供建议的工作量。

May, 2019

在未知环境中跟随自然语言指令的学习模型

本文提出了一个新的学习框架，使得机器人可以成功地遵循自然语言路线指令，而无需任何先前环境的知识。该算法利用通过命令传达给机器人的空间和语义信息来学习关于空间扩展环境的度量和语义属性的分布，并将自然语言指令解释为关于预期行为的分布。通过对地图和状态分布进行推理，使用模仿学习的新型置信空间规划器直接求解策略，我们在可声控轮椅上评估了我们的框架。结果表明，通过学习和推理潜在的环境模型，该算法能够成功地遵循新颖的扩展环境中的自然语言路线指令。

Mar, 2015

人机对话学习

本文探讨了使用增强学习的方式，通过与人类交互并接受其反馈来提高对话代理的能力，模拟了在人工环境中的各种学习情况，介绍了适用于此类学习的模型，并通过机械土耳其实验验证了此方法。

Nov, 2016

使用自然语言命令重塑机器人轨迹：多模态数据对齐的变压器研究

本文提出了一种基于自然语言的灵活性极高的人机协作接口，将大型语言模型 (BERT 和 CLIP) 的优势与轨迹信息相结合，通过多模态注意力变换实现对用户命令的编码，并将其与轨迹信息相结合。在包含机器人轨迹的数据集上进行模仿学习，并将轨迹生成过程视为序列预测问题，通过仿真轨迹实验和真实机器人实验验证了该系统的效果优异，并证明了自然语言接口在人机协作中的优越性。

Mar, 2022