Dec, 2022

使用调制掩码的终身强化学习

TL;DR该研究论文介绍了在深度强化学习中运用调制掩蔽技术解决任务交叉影响和对抗遗忘等问题的方法,并提出一种利用预先学到的知识来学习新任务的线性组合方案,在离散和连续强化学习任务中实现了优异的性能。