ICMLMay, 2018

经验回忆元学习

TL;DR本文提出了一种形式化的环境生成方法,以针对开放式任务分布下的元学习代理,旨在在重复性场景中探索其环境而不是立即利用以前发现的解决方案。使用可微分的神经元感性记忆改进了标准 LSTM 工作记忆的元学习体系结构,并进一步在带有重复任务的五种元学习环境中进行了测试,包括赌徒问题、导航问题和随机顺序决策问题。