快速准确的作用学习

May, 2024

Quick and Accurate Affordance Learning

Fedor Scholz, Erik Ayari, Johannes Bertram, Martin V. Butz

TL;DR婴儿在环境中积极学习，塑造自己的学习课程。研究通过深度学习架构模拟这种行为，结合全局认知地图探索和局部可用性学习，使用不确定性度量来指导学习，展现了最为平衡的探索策略，并提出了协调积极生成学习课程的三个关键要素。

Abstract

infants learn actively in their environments, shaping their own learning curricula. They learn about their environments' affordances, that is, how local circumstances determine how their behavior can affect the <

infants learning environment affordance active play

发现论文，激发创造

仿真智能体的可支配性推断和主动运动控制

基于自由能最小化原则的主动推理理论，提出了一个输出 - 概率、时间预测、模块化人工神经网络结构，能够处理感觉运动信息，推理与行为相关的世界方面，并调用高度灵活、目标导向的行为，其中包括利用形成的地形图灵活驾驶、避免障碍和选择通往目的地的路径。另外，研究表明该学习代理适用于进行零样本推广，适用于不同地形的环境。

Feb, 2022

使用 Affordance Map 学习移动

本文提出了一种基于自监督学习的模块化方法，该方法将传统的几何规划与学习空间场景表示相结合，以实现对动态对象和语义约束进行自主探索和导航。在基于 VizDoom 的仿真环境中得到了验证。

Jan, 2020

使用内在动机进行层次感知发现

本文提出了一种使用内在动机来指导移动机器人利用环境中可行的任务来自主学习并适应互相关联的任务的方法。

Sep, 2020

学习 3D 环境中互动探索的可承受性景观

本研究利用增强学习方法，通过自主探索实现对未经探测的三维环境的机器人智能互动，其中包括对可利用对象的发现、高效自主行动的学习以及使用基于图像的可利用区域分割模型。实验表明，基于该方法的机器人可以智能地操作新的家居环境，并为进行下游任务，如 “找刀并将其放入抽屉中”，进行了充分的准备。

Aug, 2020

学习环境感知下的遮挡情况下 3D 关节物体操作的可供性

通过结合物体层面的可行先验和环境约束，我们提出了一个环境感知的可行性框架，该框架能够在考虑环境约束的情况下学习可行性，对于包含单个遮挡物和复杂遮挡物组合的场景具有良好的泛化效果。

Sep, 2023

基于贝叶斯深度学习的图像感知分割

提出了一种基于深度贝叶斯网络的探测物体可提供的作用及分布的算法，使用 Monte Carlo Dropout 优化了模型的准确度并在 Mask-RCNN 结构上做了修改，利用新的概率模型检测出语义和空间上的不同，并通过比较二进制掩码而非预测边界框的方法来评估概率分割，同时分析出照相机噪音和视觉难点导致的随机和确定性方差。

Mar, 2023

使用贝叶斯网络的高斯混合模型进行操作能力学习

通过感知体验，探索世界并从中自主学习，以高准确性学习行动对象和效果之间的关系描述（affordances）是机器人的关键问题之一。本文采用高斯混合模型（GMM）对传感器进行概率表示，并明确考虑了每个离散行动概念中所包含的概率分布，以提高学习准确性。

Feb, 2024

深度可供性预见：通过未来可实现的行动计划

本文提出了一种新的 affordance 表示，使机器人可以通过建模未来的 affordance 来推断长期效应，从而确定实现任务目标的最佳动作。通过该新表示，我们开发了一种 learning-to-plan 方法，Deep Affordance Foresight（DAF），通过试错学习参数化 motor skills 的 affordance 的环境模型，我们在两个挑战性的操作领域上评估了 DAF，并展示了它可以有效地学习执行多步任务，在不同的任务之间共享学习到的 affordance 表示，并学习用高维图像输入进行规划。

Nov, 2020

机器人操作的端到端操作能力学习

本研究使用视觉契合技术，通过预测关键点的接触信息，提出了一种端到端的控制策略学习框架，可以实现在不同类型的操纵任务中的泛化。结果显示，我们的算法在成功率上大大优于基线算法，包括基于视觉契合和强化学习方法。

Sep, 2022

基于强化学习的深度机器人可供性学习的最新进展

本文综述了近期深度机器人可支配学习 (DRAL) 的研究进展，该方法致力于开发数据驱动的方法，使用可支配性概念辅助机器人任务，对机器人任务的技术细节和局限性进行了分类和讨论，并从观察、行为、可支配性表达、数据收集和实际部署等方面总结了它们的挑战和未来方向。同时提出了一个有前途的未来方向，即将强化学习与可支配性定义相结合，以预测任意行为后果。

Mar, 2023