ICMLMay, 2023
基于隐式和双向课程的无演示自主强化学习
Demonstration-free Autonomous Reinforcement Learning via Implicit and Bidirectional Curriculum
Jigang Kim, Daesol Cho, H. Jin Kim
TL;DR提出了一种新的强化学习算法 -“隐式和双向课程算法”(IBC),该算法能够在无需演示数据的情况下,通过辅助主体和双向目标课程实现自主学习,与现有的自主强化学习方法相比表现更好且具有更广泛的适用性。