Feb, 2024

预训练数据中的并行结构促进上下文学习

TL;DR通过检测训练模型的一对短语是否关注拓展,我们发现预训练数据中的平行结构在很大程度上影响预训练语言模型在不同上下文学习 (ICL) 任务中的准确性。移除这些平行结构会使得模型的 ICL 准确性下降 51%,这表明平行结构在 ICL 中的重要性和多样性。