将语言与取放物任务结合
本篇论文提出了一个通过深度学习技术处理自然语言和解决口语指令歧义的综合系统,旨在帮助机器人进行有效的人机交互,研究结果表明,通过建立对话式交互模型,机器人能够有效地理解和执行人类自然语言指令,并提高物体拾取任务的成功率。
Oct, 2017
该论文介绍了一种将自然语言命令翻译成离散机器人动作的方法,并使用澄清对话共同改进语言解析和概念基础。将这个代理程序训练和评估在亚马逊的 Mechanical Turk 平台上的虚拟环境,并在真实环境中将学习到的代理迁移到物理机器人平台进行演示。
Mar, 2019
本文提出了一种基于语法的自然语言机器人编程框架,特别用于拾取和放置任务,其方法使用自定义的动作词词典来存储共享意义的单词,通过增加更多的动作词从词汇数据库,轻松扩展词汇量。本文通过模拟和现实世界的实验验证了我们的自然语言机器人编程(NLRP)框架,使用配备了校准相机和麦克风的 Franka Panda 机器人手臂,并将参与者要求使用口头命令完成拾取和放置任务,该任务经由 Google 的语音转文本 API 转换为文本并通过 NLRP 框架处理,以获取机器人的联合空间轨迹,该方法具有高的系统可用性得分,可以轻松扩展字典而不依赖于转移学习或大型数据集,未来我们计划通过综合用户研究比较所述框架与不同人类辅助拾取和放置任务的方法
Apr, 2023
我们提出了一种对象为中心的框架,利用基础模型来对参考对象和空间关系进行基础建模,使得机器人可以生成满足语言指令中所有空间关系限制的放置位置,该模型可提高训练数据的利用效率并具有更强的泛化性能,在只有 25% 的训练数据下,我们的模型仍然表现优于目前最佳方法,且可以达到 97.75% 的放置成功率。
Apr, 2023
在本文中,我们研究了机器人技术中的一个基本任务 —— 拾取和放置。通过结合仿真驱动的物理稳定性验证和大型语言模型的语义推理能力,我们提出的方法能够在给定上下文信息的情况下,输出放置任务的可能候选位置的概率分布,考虑到任务的稳定性和合理性。我们在两个仿真环境和一个真实环境中对我们的方法进行了广泛评估,并展示了我们的方法在考虑用户偏好的情况下,显著提高了放置任务的物理可信度和上下文合理性。
Sep, 2023
本文介绍了一个新的推理任务,旨在针对三维对象的视觉和非视觉语言,并介绍了用于区分对象的几种 CLIP 模型。虽然最近在联合建模视觉和语言方面取得了进展,但这些基于图像的模型仍然对对象的三维性质了解不足,此文发现,将视图估计添加到语言引理模型可以提高准确性。
Jul, 2021
本文提出了一种基于语言根据分割掩模的新型范例,来应对日常情况下一系列的抓取和放置机器人操作任务,通过将从掩模中传达的精确语义和几何形状与我们的多视点策略模型相结合,使我们的方法能够感知准确的物体姿态并实现样本高效学习。
Jun, 2023
本研究通过将命令与层级规划框架中所有可用的任务或子任务联系起来,实现了一种能够在多个抽象层级上解释语言的模型。该方法提高了命令的准确性和机器人的响应速度,使机器人可以高效地在不同的任务抽象层次上进行规划。
Apr, 2017