Jul, 2022

稀疏奖励任务元强化学习的行动翻译器

TL;DR通过引入action translator 对元强化学习中的奖励稀疏性和难度失衡的问题进行优化,极大提高了学习共享策略在适配新任务时的效率和性能。