- 通过翻译人类交互计划实现推广的零射击操作
我们研究如何通过大量的人类视频数据学习机器人在与未知对象交互时的多样化操作技能,采用分解方法从人类视频数据中学习人类如何完成期望任务,并将其转化为机器人的行为,从而实现零样本通用操作。
- 基于梯度的本地最佳视角规划提高对目标植物节点的感知
机器人在番茄大棚中越来越多地用于自动化劳动密集型任务,但面临着植物其他部分的遮挡引起的感知困难。我们提出了一种基于梯度的下一最佳观测点规划方法,通过差分射线采样直接估计视点规划的局部梯度方向,旨在克服遮挡问题并提高感知质量,在模拟实验中证明 - MM人机交互中衡量信任的常见 (好的) 实践
信任是人们对机器人和技术进行采纳的重要因素,因此研究过去几十年的文献主要关注于测量人们对机器人和技术的信任程度,特别是在人机交互方面。本文中,我们概述了当前的研究方法及其优势,提出了一些薄弱方面,并讨论了在人机交互中影响信任度的更全面因素的 - 教授机器人建立关于自身的仿真模型
通过使用自我监督学习框架,我们使机器人能够只使用简短的原始视频数据来模拟和预测其形态、运动学和运动控制,从而实现了准确的运动规划和异常检测。
- SceneScore:学习对象布置的成本函数
通过学习 cost function 和图神经网络,我们的方法 SceneScore 能够评估目标排列的可取性,从而实现对缺失目标的姿态预测以及与其他约束条件的组合。
- 基于 CLIP 的语言引导机器人抓取:在杂乱环境中的参考抓取合成
这项研究关注于在人类中心环境中操作的机器人,通过整合视觉定位和抓握能力,根据用户指令高效操纵物体。首先创建了一个基于 OCID 数据集中杂乱室内场景的难题基准,其中生成指代表达式并与 4 自由度的抓握姿势相连接,然后提出了一种新颖的端到端模 - 使用深度关键点检测和点云进行番茄果梗节点的三维姿态估计
通过使用 RGB-D 相机数据,本文提出了一种基于关键点检测的方法,用于估计植物叶梗节点的三维姿态,为收获番茄束提供了必要的信息。该方法在商业温室中进行了全面评估,结果表明在物体检测、关键点检测和三维姿态估计方面具有高准确性。此外,该方法对 - 即时适应:单机器人部署的行为调节
现实世界的机器人需要在训练中未曾见过的情况下适应,本文研究了在部署过程中如何通过采用多样化的先前学习行为库来实时适应新奇场景的问题,提出了一种基于预训练行为的感知价值来选择和调整行为的 ROAM 机制,该机制在测试时的单个情节内完成自适应过 - 将通用场景描述转化为机器人环境知识图谱
探索将虚拟现实技术用作机器人环境建模的实现方法,并提出一种将场景图转化为知识库的技术。利用通用场景描述(USD)格式将基于 USD 的环境模型转化为知识图谱,从而便于语义查询和与其他知识源的集成。
- G2-MonoDepth: 从单目 RGB+X 数据进行广义深度推断的通用框架
该论文研究了单目深度推断的统一任务,从各种机器人的不同场景中的各种原始数据中推断出高质量的深度图。开发了基本的基准测试 G2-MonoDepth,应用于深度估计、不同稀疏度的深度完成和未见场景中的深度增强,并在真实数据和合成数据上始终优于最 - 机器人系统的智能逃逸:方法、应用和挑战综述
智能逃生是一个跨学科领域,利用人工智能(AI)技术使机器人能够智能地应对动态、复杂和不可预测的危险情景。本文对智能逃生的最新研究工作进行了全面调查,综述了四种主要的智能逃生方法,并总结了现有方法的优点和局限性。此外,还讨论了智能逃生在搜救、 - 高效机器人应用的因果发现
利用机器人实现快速而准确的因果分析,以提高机器人与人类的交互质量。
- 通过任务示范实现形态不同机器人之间的对应学习
我们提出了一种学习不同机器人之间的对应关系的方法,并通过一系列实验验证了该方法的有效性。
- 使用 Sum-GP-UCB 估计相互作用物体的材料属性
机器人需要从观察中估计物体的材料和动态特性,本研究提出了基于贝叶斯优化的方法来识别物体的材料属性参数,通过对不同场景下互动物体的观察进行估计,利用奖励函数的结构,仅使用场景中对象的参数作为输入,得到更好的广义模型来加速优化过程,还通过部分评 - 你在意什么?致力于机器人学习的视觉表征对齐
通过人类反馈,提出了一种用于解决视觉表征对齐问题和视觉奖励学习问题的方法:表示对齐的基于偏好的学习(RAPL)。在 X-MAGICAL 和机器人操纵的实验中,RAPL 的奖励 consistently 生成高样本效率的优选机器人行为,并在视 - IJCAI协作多智能体声学测量
通过机器人之间的合作,有效移动并进行发射 / 接收扫频信号,以测量环境的声学特性并减小预测误差,我们提出了解决多智能体协同环境声学测量问题的首个问题定义和解决方案。
- GRID:通用机器人智能开发平台
机器智能、机器人、自主系统是研究论文的主要关键词,并且通过引入新的平台,通过物理能力、环境约束和目标来解决人工智能在机器人中的问题。
- ConceptGraphs: 开放词汇三维场景图用于感知和规划
为了使机器人能够执行各种任务,本研究提出了一种名为 ConceptGraphs 的基于图结构的 3D 场景表示方法,通过将 2D 基本模型的输出与多视图关联相结合,不需要收集大型 3D 数据集或微调模型即可实现对新的语义类进行泛化推理,并通 - PolarNet: 基于语言引导的机器人操作的 3D 点云
通过使用 3D 点云来进行语言引导的操纵任务,我们提出了一种名为 PolarNet 的策略,该策略通过精心设计的点云输入、高效的点云编码器和多模态变换器来学习 3D 点云表示并将其与语言指令集成以进行行动预测。在 RLBench 基准测试中 - ObVi-SLAM:长期物体视觉 SLAM
ObVi-SLAM 是一种结合了低级视觉特征和持久目标的长期地图,在不同环境下生成准确的定位估计,适用于长时间尺度的机器人任务。