具有非稳态相互依赖关系的自主开放式任务学习

May, 2022

具有非稳态相互依赖关系的自主开放式任务学习

Autonomous Open-Ended Learning of Tasks with Non-Stationary Interdependencies

Alejandro Romero, Gianluca Baldassarre, Richard J. Duro, Vieri Giuliano Santucci

TL;DR该论文提出了一种基于马尔可夫决策过程的分层架构，使用内在动机最大化机器人学习多个具有关联性目标的能力，并提出了一种新的系统H-GRAIL来记录自主获取的任务序列，以能够在非稳态情况下修改它们。

Abstract

autonomous open-ended learning is a relevant approach in machine learning and robotics, allowing the design of artificial agents able to acquire goals and motor skills without the necessity of user assigned tasks. A crucial issue for this approach is to develop strategies to ensure tha

发现论文，激发创造

具有自动课程学习特性的内在动机目标探索过程

本论文提出了一种基于内在动机的目标探索算法，结合自主学习过程和增量式目标策略搜寻探索，可以自动生成任务序列并发掘多种技能，无需特定的目标指令，适用于机器人等人工智能设备的自主发展学习。

Aug, 2017

社交引导下内在动机学习者积极选择教师、学习策略和目标

介绍了一种基于SGIM-ACTS架构的主动学习方法，帮助机器人通过对多种教师的学习来达到多种目标，包括掌握数据收集策略、实现运动技能和在新情况下进行泛化，该方法在实验中表现出了显著的学习效果。

Apr, 2018

基于情境的自监督机器人学习中的虚拟目标

研究了机器人如何通过无监督学习和条件目标设定模型自主地学习和实践行为，从而掌握丰富的技能和处理不同的任务和环境。

Oct, 2019

自我目标驱动的内在动机条件强化学习下的Autotelic Agents：一个简短调查

本文介绍了发展性强化学习并提出了一个基于目标条件强化学习的计算框架，以解决本能动机技能获取问题，着重探讨了在自主系统中学习目标表示和优先级的现有方法，并讨论了在 intrinsically motivated skills acquisition 中的一些挑战。

Dec, 2020

使用内禀动机学习目标条件策略的深度强化学习

本文提出了一种新的无监督学习方法，名为具有内在动机的目标导向策略（GPIM）。通过将抽象级别的策略与目标条件策略联合学习，本方法在各种机器人任务中证明了其有效性和高效性，大大优于先前的技术。

Apr, 2021

可执行模型: 无监督离线强化学习的机器人技能

本文提出了使用自回归进行离线机器人技能学习，并通过先前的数据学习环境的形式理解，该方法可以处理高维相机图像，可以学习到许多技能，并通过一系列技术进行训练，此方法具有较强的泛化能力，可以在多个目标之间进行目标链接，通过预训练或辅助目标学习到丰富的表示。

Apr, 2021

机器人内在动机和自动课程学习实现逐步复杂任务

提出了一种多任务学习的层级强化学习框架，名为SGIM-SAHT，用于使机器人完成各种复杂的控制任务，并演示了该框架能够学习到基本的任务和复合任务之间的层次关系，从而实现了从简到难的任务学习，并通过表示任务依赖性、内在动机探索、主动模仿等途径，使机器人能够推断出自己的任务学习进度，并决定何时、如何、以及向谁进行模仿学习。

Feb, 2022

无任务离线强化学习的潜在计划

本研究提出了一种层次化的方法，将模仿学习和离线强化学习的优点相结合，学习从高维相机观察中获得与任务无关的长时程策略，并通过技能链接来合并潜在的行为先验，以达到以前未见的技能组合，从而更好地控制机器人的实验结果。

Sep, 2022

目标条件智能体开放式学习问题定义

开放式学习是一个复合概念，其核心特性是在无限时间内不断产生新元素，并以开放式目标条件下的强化学习问题为重点研究领域。该研究旨在定义开放式学习的基本属性，并探讨其与相关概念的区别与联系，以填补目前在发展性人工智能研究中的知识空白。

Nov, 2023

开放式学习机器人的目标: 一个计算分类、定义和操作化

通过内在动机和自主生成的目标的引导，自主开放式学习（OEL）机器人能够通过与环境的直接交互累积地获得新的技能和知识。本研究针对OEL机器人在获得的知识与用户任务的相关性之间存在的问题，提出了基于'purpose'的概念的解决方案，并开发了一个具有三层动机层次结构的计算框架，从而使机器人能够自主学习并专注于获取与设计师和用户目的相关的目标和技能。

Mar, 2024