Aug, 2024

技能正则化的多任务离线强化学习任务分解

TL;DR本研究解决了在离线强化学习中,由于任务数据质量差异导致的多任务最优策略获取困难的问题。提出了一种基于技能的多任务强化学习技术,通过联合学习共享知识与任务分解,利用Wasserstein自编码器有效地将技能和任务映射到同一潜在空间,进而提升模型性能。实验结果表明,该方法在不同质量数据集的混合配置下具有较强的鲁棒性,并在多项机器人操作和无人机导航任务中超越了现有最先进算法。