Jul, 2023

分层赋权: 实现可行的基于赋权的技能学习

TL;DR通用目标代理需要大量的技能。我们介绍了一种新的框架,层次赋权,在计算赋权时将自目标条件层次强化学习的概念整合进去,通过引入变分下界和层次结构计算赋权。这个框架的研究证实,我们的四级代理能够学习涵盖比之前工作大两个数量级的技能,以在模拟机器人任务中验证其贡献。