互动就是你所需要的?关于机器人理解和执行能力的研究
引入 TEACh 数据集,通过三个基准测试,研究基于人类空间的机器人必须能够与人进行自然语言交互,理解和执行指令,使用会话来解决模糊性并从错误中恢复的具体挑战。
Oct, 2021
本研究提出了一种基于 Transformer 的方法来处理人类语言指令和多视角场景观察,以提高机器人的精准操作,并在 RLBench 基准测试中成功实现 74 项任务,还表现出对未曾见过变化的任务的良好泛化性能。
Sep, 2022
该论文介绍了一种将自然语言命令翻译成离散机器人动作的方法,并使用澄清对话共同改进语言解析和概念基础。将这个代理程序训练和评估在亚马逊的 Mechanical Turk 平台上的虚拟环境,并在真实环境中将学习到的代理迁移到物理机器人平台进行演示。
Mar, 2019
一个互动机器人框架可以完成长期任务规划,并能在执行过程中轻松推广到新目标或不同任务。通过语言模型实现了高级规划和低级功能执行的系统,实现了对未知目标的新颖高级指令的生成,并通过仅替换任务指南来适应不同任务,而无需复杂的提示工程。此外,当用户发送新请求时,系统能够根据新请求、任务指南和先前执行步骤精确地重新规划。
Oct, 2023
本研究通过提出一个包含建议的协议来增加物理基础语言理解任务的交互带宽,并在块世界任务上评估了该方法的有效性,发现简单的建议可以显著提高任务性能,同时也探讨了模型自动生成建议以减少提供建议的工作量。
May, 2019
本文提出了一个新的学习框架,使得机器人可以成功地遵循自然语言路线指令,而无需任何先前环境的知识。该算法利用通过命令传达给机器人的空间和语义信息来学习关于空间扩展环境的度量和语义属性的分布,并将自然语言指令解释为关于预期行为的分布。通过对地图和状态分布进行推理,使用模仿学习的新型置信空间规划器直接求解策略,我们在可声控轮椅上评估了我们的框架。结果表明,通过学习和推理潜在的环境模型,该算法能够成功地遵循新颖的扩展环境中的自然语言路线指令。
Mar, 2015
本文探讨了使用增强学习的方式,通过与人类交互并接受其反馈来提高对话代理的能力,模拟了在人工环境中的各种学习情况,介绍了适用于此类学习的模型,并通过机械土耳其实验验证了此方法。
Nov, 2016
本文提出了一种基于自然语言的灵活性极高的人机协作接口,将大型语言模型 (BERT 和 CLIP) 的优势与轨迹信息相结合,通过多模态注意力变换实现对用户命令的编码,并将其与轨迹信息相结合。在包含机器人轨迹的数据集上进行模仿学习,并将轨迹生成过程视为序列预测问题,通过仿真轨迹实验和真实机器人实验验证了该系统的效果优异,并证明了自然语言接口在人机协作中的优越性。
Mar, 2022