Dec, 2022

元学习变形金刚进行上下文通用学习

TL;DR本文研究了通过 Meta-learning 或者说 Learning-to-learn 的方式来训练黑盒子模型成为通用的上下文学习算法,同时发现相比于标准模型,黑盒子模型训练时的瓶颈不是参数数量而是可以访问的状态大小。此外,本文提出了一些实际操作手段,如改变训练集分布来改善通用学习算法的 Meta-training 和 Meta-generalization。