ICMLFeb, 2018

具备复杂突触的持续强化学习

TL;DR本文研究了使用突触模型可以减轻人工神经网络中存在的 “灾难性遗忘” 现象,从而实现多时间尺度的持续学习并减少经验回放数据库在任务内的遗忘。