基於内在動機的自我意識代理學習玩耍
通过实现以好奇心驱动的内在动机的神经网络,我们表明计算的内在动机模型可能解释婴儿发展视觉运动学习的关键特征,包括自我运动预测、物体注意以及物体获取等。
Feb, 2018
本研究使用虚拟婴儿代理,在无外部奖励的情况下,测试了与人类探索的动机类似的内在奖励功能,并发现了好奇心式的内在奖励和有关性交互的连续性有助于引发探索和生成动态的社交行为和强大的预测世界模型。
May, 2023
研究探索通过推断环境因果结构以收集相关干预数据为手段,建立捕捉传感器运动交互背后真实物理机制的世界模型对于提高深度学习、强化学习、迁移学习和泛化能力至关重要。
Aug, 2022
通过对智能体控制完成的问题广泛应用增强学习方法进行研究。 基于发展心理学中的内在动机的概念,提出了一个系统性方法来确定内在动机的现有方法。该方法分为三类,分别为互补的内在奖励,探索策略和内在动机的目标。 具有世界模型和内在动机的代理的架构被描述出来,以帮助提高学习能力,同时探讨了在这一领域开发新技术的潜力。
Jan, 2023
该论文提出了一个理论框架来推动构建自我发起的开放世界学习(SOL)代理的研究,讨论和解决了在实现完全自主可学习代理方面的挑战,特别是如何自动化地检测未知的情况或新奇情况,并适应或调整代理以从中学习,提高代理的适应能力和任务性能。
Oct, 2021
本文介绍了发展性强化学习并提出了一个基于目标条件强化学习的计算框架,以解决本能动机技能获取问题,着重探讨了在自主系统中学习目标表示和优先级的现有方法,并讨论了在 intrinsically motivated skills acquisition 中的一些挑战。
Dec, 2020
通过提出动态协同(Alice 和 Bob)的兴趣课程,使用一种适当的奖励机制,有效地进行无人监督的强化学习,用于环境感知系统中的智能体的训练
Mar, 2017
本文研究通过使用图神经网络的不同策略表示和两种目标空间,即基于几何或基于谓词的,对自我目标代表和设置的兴趣驱动智能体的学习和转移能力的影响,并表明这种方法有助于实现更困难的目标学习。
Apr, 2022