Jun, 2024

多任务强化学习中的共享独特特征及任务感知优先采样

TL;DR在多任务强化学习领域,我们观察到当前最先进的方法存在性能不平衡问题。为解决这一问题,我们提出了一种名为 STARS 的新的有效方法,它包含两种新颖的策略:共享独特特征提取器和任务感知的优先采样。经过在主流的 Meta-World 基准测试中的实验证明,STARS 在统计意义上优于当前最先进的方法,并且缓解了性能不平衡问题。此外,我们还可视化了学到的特征,以支持我们的论述并增强 STARS 的可解释性。