KDDMay, 2024

MAML-en-LLM:模型不可知的元训练 LLMs 对于改进上下文学习

TL;DR我们提出了 MAML-en-LLM,一种新的元训练大型语言模型的方法,可以学习到真正可泛化的参数,不仅在不同任务上表现良好,还适应了未知任务,并且在性能和适应性能上得到了显著提升。