Jul, 2022

基于后继特征的元强化学习

TL;DR为了实现多任务学习和数据效率,提出了一种基于环境变量和后继特征框架的元强化学习方法,可在减少环境交互的情况下实现具有竞争力的性能和数据效率。