诱导自然语言处理模型中的大脑相关偏倚

Oct, 2019

诱导自然语言处理模型中的大脑相关偏倚

Inducing brain-relevant bias in natural language processing models

Dan Schwartz, Mariya Toneva, Leila Wehbe

TL;DR本研究证明对BERT模型进行微调，可提高其对人们阅读文本时脑活动的预测能力，模型学习到的语言与脑活动之间的关系可以跨越多个参与者，同时不影响模型在自然语言处理任务方面的表现，这对于研究大脑中的语言理解具有显著意义。

Abstract

Progress in natural language processing (NLP) models that estimate representations of word sequences has recently been leveraged to improve the understanding of language processing in the brain. However, these mo

发现论文，激发创造

利用大脑的自然语言处理能力解释和改进机器的自然语言处理

提出了一种新颖的解释方法，利用人脑阅读复杂自然文本时的脑成像记录来解释最新的四个NLP模型——ELMo、USE、BERT和Transformer-XL中的词和序列嵌入，研究它们在层深度、上下文长度和注意类型之间的差异，并推测改变BERT以更好地对齐脑成像记录将使其更好地理解语言。

May, 2019

人工和人类神经语言表示的关联

对比句子编码模型在大脑解码任务上的表现，发现语法轻量级表示能够显著提高脑解码性能，这一结果限制了自然语言理解模型解释人类大脑语言功能的空间，同时也揭示了使用fMRI人脑成像技术解码精细句法信息的局限性。

Oct, 2019

神经语言任务分类：哪些自然语言处理任务最能预测fMRI脑活动？

本文探索基于任务特征学习的Transformer模型在基于两个数据集的大脑编码预测中的表现和认知洞察，并发现语法和语义任务在处理阅读和听力刺激时在大脑区域上均具有良好的预测性能。

May, 2022

神经语言模型并非一出生就适合大脑数据，但训练有助于改善

本文探讨了使用神经语言模型对大脑活动进行研究的方法，主要研究了测试损失、训练语料库和模型架构对捕捉大脑活动的影响，并提出了未来研究的良好实践建议。

Jul, 2022

BERT中的人工神经元与人脑中的生物神经元的耦合

本研究旨在解决通过构建细粒度的NLP模型与具有功能性的fMRI数据捕捉大脑活动进行相互关联的问题，从而在将来提供有关NLP模型的神经启示。

Mar, 2023

微调与提示微调的监督表示：哪种更好地解释了大脑语言表示？

通过比较prompt-tuning和fine-tuning的表示，在神经解码方面，我们发现对于10个自然语言理解任务，prompt-tuning优于fine-tuning，表明更符合大脑的调节方法获得的表征与脑部数据更相关。此外，我们发现与其他任务相比，处理细粒度概念意义的任务在解码大脑激活模式方面表现更好，尤其是句法分块任务，这表明在表示语言时，我们的大脑编码了更多细粒度的概念信息而不仅仅是浅层句法信息。

Oct, 2023

调音至神经编码：将人脑与人工监督的语言表达连接起来

我们通过研究任务调整如何影响预训练的Transformer用于神经编码，并确定了对大脑激活模式有最高预测能力的任务类型，展示了通过prompt-tuning生成的监督表示比传统的微调在四个任务上更好地预测对中文刺激的神经反应。此外，我们还揭示了经过微调的模型的调整参数比例对神经编码性能的影响。总体而言，我们的实验结果有助于更好地理解监督人工和脑语言表示之间的关系。

Oct, 2023

语音语言模型缺乏重要的与大脑相关的语义

文本和语音语言模型能够准确预测脑部活动，但是消除特定的低级刺激特征后发现语音模型失去了对大脑的预测能力，进一步研究显示语音模型需要改进以更好地反映大脑的语言处理。

Nov, 2023

人脑语言处理的计算模型研究综述

使用计算模型进行大脑研究需要丰富的测试数据集和严格的实验控制，该论文通过评估不同的计算模型在相同数据集上的表现，突出了计算模型在大脑研究中的新兴趋势。

Mar, 2024

脑语言表征导航：神经语言模型与心理合理模型的比较分析

比较神经语言模型和心理可信模型，发现心理可信模型在多种多样的背景下（包括多模态数据集、不同语言等）表现更优，尤其是在融合具象信息的心理可信模型中，对单词和段落层面的大脑活动预测表现最佳。

Apr, 2024