利用对比自监督和潜在扩散从脑活动解码现实图像

Sep, 2023

利用对比自监督和潜在扩散从脑活动解码现实图像

Decoding Realistic Images from Brain Activity with Contrastive Self-supervision and Latent Diffusion

Jingyuan Sun, Mingxiao Li, Marie-Francine Moens

TL;DR我们提出了一个名为CnD的两阶段框架，通过自监督对比学习获取功能磁共振成像数据的表示，并利用这些编码的数据重建视觉刺激，从而实现了基于人脑活动的可行的图像重建方法。

Abstract

reconstructing visual stimuli from human brain activities provides a promising opportunity to advance our understanding of the brain's visual system and its connection with computer vision models. Although deep generative models have been employed for this task, the challenge of genera

发现论文，激发创造

脑电波探幽者：从大脑活动中重构复杂图像

本文研究了如何通过结合fMRI神经活动信号、图像和图像语义描述来重建复杂的图像场景，使用深度学习模型，并且通过采用预先训练的视觉-语言潜在空间编码fMRI信号来解决数据稀缺的问题。

Sep, 2022

超越大脑：使用稀疏掩码建模的条件扩散模型进行视觉解码

本文提出了一种使用双条件潜在扩散模型的 MinD-Vis：稀疏掩蔽脑建模方法，通过大型潜在空间中的掩蔽建模来学习 fMRI 数据的有效自我监督表示。实验证明，该方法在语义映射和生成质量方面都优于现有技术，并且只需很少的成对注释即可从脑记录中重建高度合理的图像。

Nov, 2022

Brain-Diffuser:使用生成潜在扩散从fMRI信号中重建自然场景

利用神经解码技术和新型图像生成的巨大进展，我们提出了一个两阶段场景重建框架（Brain-Diffuser），它能够从fMRI信号中推断出场景的低级特征和整体布局，随后通过潜在扩散模型生成最终重建的图像。该方法在公开数据集基准测试中表现出色，在应用（例如脑机接口）和基础神经科学方面都有深远的影响。

Mar, 2023

MindDiffuser：基于语义和结构扩散的人脑活动控制图像重建

本文提出了一种名为MindDiffuser的两阶段图像重构模型，利用了稳定扩散技术，成功地同时实现了语义和结构信息的重构，并在自然场景数据集方面的重建结果超过了当前最先进模型。

Mar, 2023

通过引导性随机搜索从人脑活动中重建已见图像

利用条件生成扩散模型对大脑活动中的语义描述符进行可视化重建，有效改善了搜索策略，同时保持了低级图像细节的精细度和语义信息的一致性，并且发现该过程的收敛时间与视觉皮层的区域差异有关。

Apr, 2023

脑部字幕：将人脑活动解码成图像和文本

该研究采用fMRI技术和图像生成模型，提出了一种基于大脑神经活动解码为图像文字的方法，该方法包括图像重建流程和基于深度图的图像生成模型，实验证明其在神经科学方面具有广泛应用的潜力。

May, 2023

从脑活动中解码高分辨率图像的对比、关注和扩散

介绍了一个两阶段的fMRI表示学习框架，通过在预处理阶段使用Double-contrastive Mask Auto-encoder降噪，并在第二阶段利用图像自动编码器的指导来调整特征学习者，以关注对于视觉重建最有信息的神经激活模式。使用这种优化后的fMRI特征学习者条件下的潜在扩散模型重构图像刺激，实验结果证明该模型在生成高分辨率和语义准确的图像方面的优越性，50种不同目标的情境下，top-1语义分类的准确率比先前最先进的方法提高了39.34％。

May, 2023

通过知识蒸馏和潜在扩散模型从脑电图解码视觉大脑表示

本研究通过采用电脑脑波数据对ImageNet数据集中的图像进行分类和重建，提出了一种创新的方法。该研究不仅可以从神经活动中解码图像，还能仅利用脑电波数据生成图像的可靠重建，为个性化迅速反馈实验铺平了道路。

Sep, 2023

NeuroCine: 从人脑活动解码生动视频序列

在理解人类大脑视觉处理的复杂性中，从大脑活动中重建动态视觉体验成为一项具有挑战性且引人入胜的努力。本研究引入了NeuroCine，一种新颖的双相框架，针对解码fMRI数据中固有的挑战，如噪声、空间冗余和时间滞后。该框架通过对比学习fMRI表示进行空间遮蔽和时间插值增强，以及依赖性先验噪声增强的扩散模型用于视频生成。在一个公开可用的fMRI数据集上进行了测试，我们的方法显示出有希望的结果，通过SSIM测量，在解码三个主题的fMRI数据集中，与先前最先进的模型相比，分别提高了20.97％，31.00％和12.30％。此外，我们的注意力分析表明该模型与现有的大脑结构和功能相吻合，表明其具有生物学合理性和可解释性。

Feb, 2024

脑流：基于多模态引导的fMRI到图像重建

本研究针对fMRI到图像重建任务中小物体细节缺失和语义模糊的问题，提出了一种基于多模态引导的重建框架Brain-Streams。该框架结合视觉和语义信息，利用现代生成模型（如潜在扩散模型）进行精确的图像重建，验证结果显示出优越的重建能力和应用潜力。

Sep, 2024