在模拟环境中学习如何学习
提出了一种基于好奇心驱动的算法,通过生成适当的马达速度来控制自主学习,使四旋翼可以通过障碍物并将航向朝向目标位置,实现了最优策略的学习和最大化奖励的能力。
Jul, 2023
本文认为好奇心是一种进化机制,能够在智能体的一生中鼓励有意义的探索,以暴露它于能够使其获得高报酬的经验。该文提出了一种基于元学习的产生好奇行为的问题,并使用元学习算法将代理人的奖励信号动态调整来解决问题。作者进一步提出使用元算法来扩大其适用性,并将其他构建块(例如缓冲器、最近邻模块和定制丢失函数)与神经网络结合使用。最终,本文提出的两种好奇心算法在图像导航、机器人和其他领域表现优于人类设计的已发表算法。
Mar, 2020
本文研究了物体检测的体现式交互学习任务,提出基于自监督学习方法的探索策略,使用语义好奇心奖励轨迹样本,通过该方法训练的探索策略具有普适性,能够帮助训练出优于其他方法的物体检测器。
Jun, 2020
本文提出了一种使用深度强化学习方法,利用 RGB-D 传感器在室内环境中探索移动机器人的方法,通过对特征表示的感受野进行分析,深度强化学习促进了卷积网络估计场景的遍历性,实验结果表明,采用该方法训练的机器人控制器在真实环境中的认知能力显著提高。
Oct, 2016
通过学习无人机动力学的概率模型,我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器,完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。
Mar, 2020
本文综述了心理好奇心对于人类智能的重要作用,阐述了人工好奇心与人类认知发展的联系及其应用场景,并对强化学习、推荐系统和分类方法等领域中已有的好奇心驱动学习方法进行综述,提出了深入研究的方向和未来的改进工作。
Jan, 2022
本文提出了一种基于视觉好奇心的智能代理,通过与 Oracle 的对话,实现在开放世界环境下识别物体和属性,使用强化学习作为框架学习角色的所有组件和模块,并通过独立于视觉和特定环境的问策略,在学习了新的视觉概念后,成功运用于新领域。
Oct, 2018
该研究旨在使用深度强化学习算法,通过在模拟环境中训练机器人臂完成定位和抓取方块的任务,进而实现在真实场景下机器人控制的无缝转移,并设计了结构化奖励函数以提高训练效率。
Sep, 2016
本文阐述了如何将深度强化学习算法应用于机器人领域,主要关注于以物理模拟平台为基础的无人机飞行任务控制,使用基于 Gazebo 的强化学习框架进行训练,最终成功实现了无人机自主降落的任务
Sep, 2022