Sep, 2022

强化学习任务状态对应关系的学习,用于知识迁移

TL;DR该研究提出了一种基于生成对抗网络模型的一对一转移学习方法,旨在解决深度强化学习中新任务的知识重用和泛化问题。