Sep, 2023

MindGPT:使用非侵入性脑记录解读所见

TL;DR通过 fMRI 信号解释感知到的视觉刺激为自然语言的一种非侵入性神经解码器 MindGPT,该模型建立在具有交叉注意机制的视觉引导神经编码器上,并通过大型语言模型 GPT 的协同使用来将潜在的神经表示引导到期望的语义方向,从而使 MindGPT 的神经表示具有可解释性,可以用来评估视觉属性对语义的贡献。实验证明生成的词序列真实地代表了感知刺激中传达的视觉信息(具有关键细节),结果还表明,对于语言解码任务,高级视觉皮层(HVC)比低级视觉皮层(LVC)更具语义信息,仅使用 HVC 就可以恢复大部分语义信息。MindGPT 模型的代码将公开发布在此 https URL 上。