May, 2019

序列策略的元学习

TL;DR在这篇论文中,我们回顾了基于记忆的元学习作为构建在目标类中适应任何任务的节约样本策略的工具,并通过基本算法模板提供构建近乎最优预测器和强化学习器的概念基础。此外,我们将记忆性元学习重新放入贝叶斯框架内,展示元学习策略接近最优,因为它们分摊了贝叶斯滤波之后的数据,其中适应在内存动态中实现为足够统计的状态机。基本上,基于记忆的元学习将概率序列推断的困难问题转化为回归问题。