ICLRMar, 2024

跨模态功能磁共振成像解码视觉和语言

TL;DR通过大规模的功能性磁共振成像 (fMRI) 数据集,本研究提出并使用了一种新的模态不可知解码器,能够将大范围的视觉、语言和多模态模型的脑信号映射到刺激表示上,发现模态不可知解码器表现与模态特定解码器相当甚至更好,并且单模态解码器表现与多模态解码器相当,同时高级的视觉区域可以很好地解码文本和图像刺激。