功能融合网络
本文提出了一种基于 Markov Decision Processes 的行动效益理论,它能够加速计划过程,同时提高学习效率和准确性,特别是在需要函数逼近的模型中。文中还介绍了一种学习行动效益的方法,并将其用于估计更简单且泛化能力更强的状态转移模型。
Jun, 2020
本文回顾了在机器人任务中使用借助能力概念的不同策略,并构建这些方法以提供指导,包括能力作为提高自主性的机制。最后,我们确定并讨论了一系列有趣的借助能力研究方向,这些方向有潜力提高 AI 代理的能力。
May, 2021
通过感知体验,探索世界并从中自主学习,以高准确性学习行动对象和效果之间的关系描述(affordances)是机器人的关键问题之一。本文采用高斯混合模型(GMM)对传感器进行概率表示,并明确考虑了每个离散行动概念中所包含的概率分布,以提高学习准确性。
Feb, 2024
通过结合物体层面的可行先验和环境约束,我们提出了一个环境感知的可行性框架,该框架能够在考虑环境约束的情况下学习可行性,对于包含单个遮挡物和复杂遮挡物组合的场景具有良好的泛化效果。
Sep, 2023
通过利用经过预训练的大规模视觉语言模型中的丰富世界、抽象和人 - 物体相互作用知识,我们提出的模型在自然环境中的对象可承受性接地任务上展示出明显的性能提升,我们进一步证明它可以对训练过程中未见过的随机互联网图像中的对象进行可承受性接地。
Jan, 2024
本文提出了一种有效的注释方案,通过将目标无关的运动动作和抓握类型作为能力标签,并引入机械动作概念来描述两个物体之间的动作可能性,解决了现有数据集中的问题,并通过将此方案应用于 EPIC-KITCHENS 数据集来验证了模型的有效性。
Jun, 2022
机器人学中的可行性是指机器人必须感知到的关键属性,以有效地与新型物体交互的核心概念,该综述文章特别关注机器人学,并尝试找到不同方法之间的共同点,我们提出基于先前知识水平的分类,用于建立有助于实现机器人任务的不同可行性组件之间的关系。
Apr, 2020
本文提出了一种新的 affordance 表示,使机器人可以通过建模未来的 affordance 来推断长期效应,从而确定实现任务目标的最佳动作。通过该新表示,我们开发了一种 learning-to-plan 方法,Deep Affordance Foresight(DAF),通过试错学习参数化 motor skills 的 affordance 的环境模型,我们在两个挑战性的操作领域上评估了 DAF,并展示了它可以有效地学习执行多步任务,在不同的任务之间共享学习到的 affordance 表示,并学习用高维图像输入进行规划。
Nov, 2020