自然语言的元预测学习模型

Sep, 2023

Meta predictive learning model of natural languages

Chan Li, Junbin Qiu, Haiping Huang

TL;DR基于自注意力机制的大型语言模型在语言处理和自然语言本身中取得了惊人的成绩，并且在不同性质的各种任务中也取得了成绩。本文在预测编码框架内提出了一个平均场学习模型，成功地验证了其在分类手写数字和玩具以及真实语言语料库中的有效性。因此，我们的模型为研究语言处理和意想不到的普遍智能的物理和生物对应关系提供了一个起点。

Abstract

large language models based on self-attention mechanisms have achieved astonishing performances not only in natural language itself, but also in a variety of tasks of different nature. However, regarding processi

large language models self-attention mechanisms predictive coding framework language processing emergent behavior

发现论文，激发创造

利用 fMRI 数据的大脑预测编码进行语言重建

提出了一种用于神经解码和脑预测的新模型 extsc {PredFT}，它结合了主要解码网络和用于预测编码的辅助网络，并通过交叉注意力将脑预测编码表示融入主要解码网络以促进语言模型的生成过程。在最大 BLEU-1 分数为 27.8% 的自然语言理解 fMRI 数据集 Narratives 上进行了实验，取得了当前最先进的解码性能。

May, 2024

大型语言模型朝向类脑词表示的收敛

大型语言模型的神经表示与脑成像测量的神经响应非常相似，因此表明该模型可以产生类人的表示。

Jun, 2023

从人类行为角度探索语言模型

基于人类行为学视角，我们探究了大型语言模型（LLMs）的预测过程和内部机制，通过将 LLMs 的值与眼动测量结果相关联，发现 LLMs 表现出与基于 RNN 的语言模型不同的预测模式。此外，随着前馈网络（FFN layers）的升级，记忆和语言知识编码的能力也逐渐提升直至达到巅峰，并转向注重理解能力。自注意力机制的功能分布在多个头部。最后，我们审查了门控机制，发现它们控制信息的流动，有些门控机制促进信息的传递，而其他门控机制则消除信息。

Oct, 2023

语言模型中的因果图重新发现人类叙事处理中的皮质层级

通过比较语言模型特征对大脑活动的预测准确性，研究发现语言模型和人脑在语言信息处理方面存在相似性。

Nov, 2023

诱导自然语言处理模型中的大脑相关偏倚

本研究证明对 BERT 模型进行微调，可提高其对人们阅读文本时脑活动的预测能力，模型学习到的语言与脑活动之间的关系可以跨越多个参与者，同时不影响模型在自然语言处理任务方面的表现，这对于研究大脑中的语言理解具有显著意义。

Oct, 2019

奖励调节 STDP 的突触可塑性神经元脉冲伪学习

提出了一个受海马体和前额叶皮质启发的生物学上可行的元学习模型，其使用尖峰神经网络和基于奖励的学习系统来实现在低数据条件下的快速学习并避免了灾难性遗忘，并且可以轻松地应用于脉冲神经形态学设备和在 few-shot 分类任务中展示了其与现有技术的竞争力。

Jun, 2023

多模态大型语言模型在预测语言处理中体现人类式的视觉 - 语言整合的证据

大型语言模型（LLMs）的高级语言处理能力引发了关于它们是否能够复制类似人类认知过程的能力的讨论，本文通过研究多模态语言模型（mLLMs）中的视觉关注权重，发现与人类一样，mLLMs 中基于多模态输入的预测性语言处理过程也会受到视觉特征的注意引导。

Aug, 2023

LaMPP: 语言模型作为感知和行动的概率先验

使用自然语言处理模型，我们将标签和决策转化成基于概率图模型的推断，进而实现对语义分割、家庭导航和活动识别任务的精确预测，提高对于罕见、不常见以及结构新颖输入的预测能力。

Feb, 2023

脑语言表征导航：神经语言模型与心理合理模型的比较分析

比较神经语言模型和心理可信模型，发现心理可信模型在多种多样的背景下（包括多模态数据集、不同语言等）表现更优，尤其是在融合具象信息的心理可信模型中，对单词和段落层面的大脑活动预测表现最佳。

Apr, 2024

学习生成模型的神经编码框架

提出了一种基于预测处理理论的神经生成模型计算框架，通过构建神经元层次结构，预测邻居神经元的工作并根据预测与观测结果的差异更新神经元参数来训练模型，实验结果表明，该模型在多个基准数据集和度量标准上表现出色，并具有与功能类似的其他生成模型相媲美甚至优越的性能。

Dec, 2020