Dec, 2024

强化学习与模仿学习的内在动机在连续任务中的应用

TL;DR该研究解决了发展认知机器人领域中强化学习和模仿学习之间的桥接问题,提出了一种基于经验进展的内在动机公示,以便学习者能够主动选择适合的学习策略和任务。研究表明,这种对学习过程中主动请求辅导的设计使得学习者在辅导质量较低的情况下,仍能更快地学习多个任务,从而推动了自动课程学习的进步。