在模拟环境中学习如何学习

AAAIFeb, 2019

Learning to Learn in Simulation

Ervin Teng, Bob Iannucci

TL;DR本研究使用深度强化学习技术训练一种好奇心代理以促进物体检测模型在线学习。我们还提出了一种奖励函数，以权衡代理的两个目标：尽快完成训练或尽可能少地进行人工介入，并考虑了 drone 平台的部分物理特性。

Abstract

deep learning often requires the manual collection and annotation of a training set. On robotic platforms, can we partially automate this task by training the robot to be curious, i.e., to seek out beneficial training information in the environment? In this work, we address the problem

deep learning robotics curiosity object detection reinforcement learning

发现论文，激发创造

基于好奇心驱动的强化学习的低层次飞行控制

提出了一种基于好奇心驱动的算法，通过生成适当的马达速度来控制自主学习，使四旋翼可以通过障碍物并将航向朝向目标位置，实现了最优策略的学习和最大化奖励的能力。

Jul, 2023

元学习好奇算法

本文认为好奇心是一种进化机制，能够在智能体的一生中鼓励有意义的探索，以暴露它于能够使其获得高报酬的经验。该文提出了一种基于元学习的产生好奇行为的问题，并使用元学习算法将代理人的奖励信号动态调整来解决问题。作者进一步提出使用元算法来扩大其适用性，并将其他构建块（例如缓冲器、最近邻模块和定制丢失函数）与神经网络结合使用。最终，本文提出的两种好奇心算法在图像导航、机器人和其他领域表现优于人类设计的已发表算法。

Mar, 2020

主动视觉学习中的语义好奇心

本文研究了物体检测的体现式交互学习任务，提出基于自监督学习方法的探索策略，使用语义好奇心奖励轨迹样本，通过该方法训练的探索策略具有普适性，能够帮助训练出优于其他方法的物体检测器。

Jun, 2020

面向移动机器人的深度强化学习认知探索

本文提出了一种使用深度强化学习方法，利用 RGB-D 传感器在室内环境中探索移动机器人的方法，通过对特征表示的感受野进行分析，深度强化学习促进了卷积网络估计场景的遍历性，实验结果表明，采用该方法训练的机器人控制器在真实环境中的认知能力显著提高。

Oct, 2016

基于深层模型的强化学习学习飞行

通过学习无人机动力学的概率模型，我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器，完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。

Mar, 2020

从心理好奇到人工好奇：人工智能任务中基于好奇心的学习

本文综述了心理好奇心对于人类智能的重要作用，阐述了人工好奇心与人类认知发展的联系及其应用场景，并对强化学习、推荐系统和分类方法等领域中已有的好奇心驱动学习方法进行综述，提出了深入研究的方向和未来的改进工作。

Jan, 2022

视觉好奇心：学习提问以学习视觉识别

本文提出了一种基于视觉好奇心的智能代理，通过与 Oracle 的对话，实现在开放世界环境下识别物体和属性，使用强化学习作为框架学习角色的所有组件和模块，并通过独立于视觉和特定环境的问策略，在学习了新的视觉概念后，成功运用于新领域。

Oct, 2018

深度 Q-Learning 机器人臂控制的 3D 模拟

该研究旨在使用深度强化学习算法，通过在模拟环境中训练机器人臂完成定位和抓取方块的任务，进而实现在真实场景下机器人控制的无缝转移，并设计了结构化奖励函数以提高训练效率。

Sep, 2016

一种用于无人机自主降落平台的深度强化学习策略

本文阐述了如何将深度强化学习算法应用于机器人领域，主要关注于以物理模拟平台为基础的无人机飞行任务控制，使用基于 Gazebo 的强化学习框架进行训练，最终成功实现了无人机自主降落的任务

Sep, 2022

驱动好奇心的学习的计算理论

探索好奇心如何帮助机器人和人类发现解决复杂问题的新方法和技能，以及在自主学习和自组织发展中的重要性。

Feb, 2018