快速准确的作用学习
基于自由能最小化原则的主动推理理论,提出了一个输出 - 概率、时间预测、模块化人工神经网络结构,能够处理感觉运动信息,推理与行为相关的世界方面,并调用高度灵活、目标导向的行为,其中包括利用形成的地形图灵活驾驶、避免障碍和选择通往目的地的路径。另外,研究表明该学习代理适用于进行零样本推广,适用于不同地形的环境。
Feb, 2022
本文提出了一种基于自监督学习的模块化方法,该方法将传统的几何规划与学习空间场景表示相结合,以实现对动态对象和语义约束进行自主探索和导航。在基于 VizDoom 的仿真环境中得到了验证。
Jan, 2020
本研究利用增强学习方法,通过自主探索实现对未经探测的三维环境的机器人智能互动,其中包括对可利用对象的发现、高效自主行动的学习以及使用基于图像的可利用区域分割模型。实验表明,基于该方法的机器人可以智能地操作新的家居环境,并为进行下游任务,如 “找刀并将其放入抽屉中”,进行了充分的准备。
Aug, 2020
通过结合物体层面的可行先验和环境约束,我们提出了一个环境感知的可行性框架,该框架能够在考虑环境约束的情况下学习可行性,对于包含单个遮挡物和复杂遮挡物组合的场景具有良好的泛化效果。
Sep, 2023
提出了一种基于深度贝叶斯网络的探测物体可提供的作用及分布的算法,使用 Monte Carlo Dropout 优化了模型的准确度并在 Mask-RCNN 结构上做了修改,利用新的概率模型检测出语义和空间上的不同,并通过比较二进制掩码而非预测边界框的方法来评估概率分割,同时分析出照相机噪音和视觉难点导致的随机和确定性方差。
Mar, 2023
通过感知体验,探索世界并从中自主学习,以高准确性学习行动对象和效果之间的关系描述(affordances)是机器人的关键问题之一。本文采用高斯混合模型(GMM)对传感器进行概率表示,并明确考虑了每个离散行动概念中所包含的概率分布,以提高学习准确性。
Feb, 2024
本文提出了一种新的 affordance 表示,使机器人可以通过建模未来的 affordance 来推断长期效应,从而确定实现任务目标的最佳动作。通过该新表示,我们开发了一种 learning-to-plan 方法,Deep Affordance Foresight(DAF),通过试错学习参数化 motor skills 的 affordance 的环境模型,我们在两个挑战性的操作领域上评估了 DAF,并展示了它可以有效地学习执行多步任务,在不同的任务之间共享学习到的 affordance 表示,并学习用高维图像输入进行规划。
Nov, 2020
本研究使用视觉契合技术,通过预测关键点的接触信息,提出了一种端到端的控制策略学习框架,可以实现在不同类型的操纵任务中的泛化。结果显示,我们的算法在成功率上大大优于基线算法,包括基于视觉契合和强化学习方法。
Sep, 2022
本文综述了近期深度机器人可支配学习 (DRAL) 的研究进展,该方法致力于开发数据驱动的方法,使用可支配性概念辅助机器人任务,对机器人任务的技术细节和局限性进行了分类和讨论,并从观察、行为、可支配性表达、数据收集和实际部署等方面总结了它们的挑战和未来方向。同时提出了一个有前途的未来方向,即将强化学习与可支配性定义相结合,以预测任意行为后果。
Mar, 2023