BriefGPT.xyz
Feb, 2018
选择性经验回放用于终身学习
Selective Experience Replay for Lifelong Learning
HTML
PDF
David Isele, Akansel Cosgun
TL;DR
本文研究通过经验重放的方法,利用“distribution matching”算法来防止深度神经网络多任务学习中的严重忘却问题。实验探索了不同体验选择策略的优缺点,结果表明分布匹配算法可以成功避免严重忘却问题,并且在所有测试领域中始终表现最佳。同时我们发现,当部分任务的重要性比其他任务更高时,最大化状态空间覆盖率是有福利的。
Abstract
deep reinforcement learning
has emerged as a powerful tool for a variety of learning tasks, however deep nets typically exhibit forgetting when learning multiple tasks in sequence. To mitigate forgetting, we propose an
→