Feb, 2025

通过记忆增强实现元强化学习的任务广泛性

TL;DR本研究解决了强化学习在训练任务与实际任务差异时普遍存在的表现不佳问题。我们提出了一种记忆增强的方法,通过任务结构化增强模拟合理的分布外场景,并结合记忆机制实现基于上下文的策略适应。研究表明,该方法在未见任务上实现了零-shot 泛化,同时保持了强大的分布内性能和高样本效率。