Apr, 2024

目标条件的强化学习中通过自适应技能分配实现目标探索

TL;DR通过自适应技能分布来优化探索效率,并且提高对环境结构模式的利用,这能够显著改善目标导向强化学习中的探索效率,并在具有类似局部结构的未知任务中展现强大的泛化能力。