AAAIDec, 2015

通用视频游戏玩耍中的神经模块重用

TL;DR提出了一种在神经网络控制下自适应地利用先前学习的网络的知识转移方法,实现了高维序列决策领域的增量学习和知识迁移,在 Atari 2600 游戏中得到了成功的验证。