Dec, 2023

SDSRA:一种用于有效策略学习的基于技能驱动和技能重新组合的算法

TL;DR引入一种新的算法 - 技能驱动的技能重组算法 (SDSRA),该算法显著提高了在强化学习任务中实现最大熵效率的效果。通过将基于技能的策略集成到稳健的 Actor-Critic 框架中,SDSRA 在各种复杂和多样化的基准中展示出卓越的适应性和性能。