跨视角脑解码
通过大规模的功能性磁共振成像 (fMRI) 数据集,本研究提出并使用了一种新的模态不可知解码器,能够将大范围的视觉、语言和多模态模型的脑信号映射到刺激表示上,发现模态不可知解码器表现与模态特定解码器相当甚至更好,并且单模态解码器表现与多模态解码器相当,同时高级的视觉区域可以很好地解码文本和图像刺激。
Mar, 2024
本研究介绍了一种基于高质量预训练多模态表示利用功能磁共振成像技术探索人类大脑微观语义网络的方法,并描述了该方法在检测面孔、身体和空间等重要语义概念的表现及其在个体参与者中的应用。
Jun, 2023
使用 CoCa 模型,本文提出了一种简单而有效的生成框架 BrainChat,旨在从脑活动中快速实现语义信息解码任务,包括 fMRI 问题回答和 fMRI 字幕生成,通过编码稀疏的 fMRI 数据,利用对比损失将 fMRI、图像和文本嵌入对齐,然后通过交叉注意层将 fMRI 嵌入映射到生成的脑解码器,以最小化字幕损失的方式以回归的方式生成有关 fMRI 的文本内容。成功地超过了现有状态 - of-the-art 方法在 fMRI 字幕生成任务中,并首次实现了 fMRI 问题回答。此外,BrainChat 在没有图像数据的情况下仍可以实现高性能,更适用于现实世界的数据有限场景。
Jun, 2024
通过脑活动捕获的功能性磁共振成像解译人类视觉体验是神经科学研究领域的前沿挑战之一。本文介绍了 MindSemantix,这是一种新颖的多模态框架,使语言模型能够理解脑活动中唤起的语义内容,并形成无缝连接的端到端脑 - 语言模型。
May, 2024
通过数据对齐方法,我们的研究旨在引入一种针对跨个体大脑解码的泛化技术。我们使用了 NSD 数据集,利用多个受试者的数据对齐,对跨个体大脑解码进行了训练和测试,证实了即使使用约 10% 的数据或 982 个共同图像,交叉个体的大脑解码也是可行的,与单个个体解码相比性能相当。岭回归是最佳的功能对齐方法,通过受试者对齐,我们实现了更优秀的大脑解码以及可能的扫描时间缩减 90%,为更高效的实验和领域的进一步突破铺平了道路,通常需要耗费昂贵的每个受试者的 20 小时扫描时间。
Aug, 2023
我们提出了一种新的方法来解决功能磁共振成像(fMRI)数据稀缺和噪声干扰脑解码模型性能的问题,通过浅层主体特定适配器将跨学科的 fMRI 数据映射到统一的表示中,然后使用共享的深层解码模型将跨学科特征解码为目标特征空间,利用视觉和文本监督进行多模态脑解码的训练,实验证明了我们模型在所有科目中的鲁棒神经表示学习,并且将高级和低级信息相结合可以改善重建度量。
Mar, 2024
本文系统探讨了图像转换器和多模态转换器在大脑编码方面的有效性,发现多模态转换器 VisualBERT 在编码上远优于之前提出的单模态 CNN、图像转换器以及其他先前提出的多模态模型,这表明视觉语言模型的优越性,产生了人们是否在被动地查看图像时,视觉区域的响应是否受到语言处理的影响的问题。
Apr, 2022
通过生物启发的聚合函数和新颖的循环 fMRI 重建机制,提出了一种新的跨被试脑解码方法 MindBridge,能够实现跨被试脑解码,并能通过循环重建的 fMRI 实现新颖的 fMRI 合成和伪数据增强。实验证明 MindBridge 能够竞争性地为多个被试重建图像,并且在有限的新被试数据中达到较高的解码准确性,超过专门针对被试的模型。这种跨被试脑解码的进展为神经科学领域提供了更广泛的应用方向,并表明在现实场景中更高效地利用有限的 fMRI 数据的潜力。
Apr, 2024
对比句子编码模型在大脑解码任务上的表现,发现语法轻量级表示能够显著提高脑解码性能,这一结果限制了自然语言理解模型解释人类大脑语言功能的空间,同时也揭示了使用 fMRI 人脑成像技术解码精细句法信息的局限性。
Oct, 2019
通过 fMRI 信号解释感知到的视觉刺激为自然语言的一种非侵入性神经解码器 MindGPT,该模型建立在具有交叉注意机制的视觉引导神经编码器上,并通过大型语言模型 GPT 的协同使用来将潜在的神经表示引导到期望的语义方向,从而使 MindGPT 的神经表示具有可解释性,可以用来评估视觉属性对语义的贡献。实验证明生成的词序列真实地代表了感知刺激中传达的视觉信息(具有关键细节),结果还表明,对于语言解码任务,高级视觉皮层(HVC)比低级视觉皮层(LVC)更具语义信息,仅使用 HVC 就可以恢复大部分语义信息。MindGPT 模型的代码将公开发布在此 https URL 上。
Sep, 2023