Sep, 2023

自然语言的元预测学习模型

TL;DR基于自注意力机制的大型语言模型在语言处理和自然语言本身中取得了惊人的成绩,并且在不同性质的各种任务中也取得了成绩。本文在预测编码框架内提出了一个平均场学习模型,成功地验证了其在分类手写数字和玩具以及真实语言语料库中的有效性。因此,我们的模型为研究语言处理和意想不到的普遍智能的物理和生物对应关系提供了一个起点。