ICMLMay, 2023

基于隐式和双向课程的无演示自主强化学习

TL;DR提出了一种新的强化学习算法 -“隐式和双向课程算法”(IBC),该算法能够在无需演示数据的情况下,通过辅助主体和双向目标课程实现自主学习,与现有的自主强化学习方法相比表现更好且具有更广泛的适用性。