MindDiffuser:使用语义和结构扩散从人类大脑活动进行受控图像重建
本文提出了一种名为 MindDiffuser 的两阶段图像重构模型,利用了稳定扩散技术,成功地同时实现了语义和结构信息的重构,并在自然场景数据集方面的重建结果超过了当前最先进模型。
Mar, 2023
利用神经解码技术和新型图像生成的巨大进展,我们提出了一个两阶段场景重建框架(Brain-Diffuser),它能够从 fMRI 信号中推断出场景的低级特征和整体布局,随后通过潜在扩散模型生成最终重建的图像。该方法在公开数据集基准测试中表现出色,在应用(例如脑机接口)和基础神经科学方面都有深远的影响。
Mar, 2023
我们提出了一个名为 CnD 的两阶段框架,通过自监督对比学习获取功能磁共振成像数据的表示,并利用这些编码的数据重建视觉刺激,从而实现了基于人脑活动的可行的图像重建方法。
Sep, 2023
本文提出了一种名为 Controllable Mind Visual Diffusion Model (CMVDM) 的新方法,利用属性对齐和辅助网络从 fMRI 数据中提取语义和轮廓信息,并利用控制模型对提取的信息进行图像合成,与其他现有方法相比,CMVDM 在定性和定量上都具有更好的性能。
May, 2023
利用 Latent Diffusion Models (LDM) 从功能性磁共振成像(fMRI)中重建视觉刺激,NeuralDiffuser 引入基于主要视觉特征的指导以提供细节线索,扩展 LDM 方法的自下而上过程,实现忠实的语义和细节,同时通过一种新颖的指导策略确保重复重构的一致性结果。在 Natural Senses Dataset (NSD) 上取得了 NeuralDiffuser 的最新性能,提供了更忠实的细节和一致的结果。
Feb, 2024
通过人脑活动诱发的视觉刺激来进行图像重建和字幕生成,UniBrain 提出了一种统一的人脑活动扩散模型,通过 fMRI 转换文本和图像潜在信息,并通过 CLIP 引导反向扩散过程,从而生成具有低级细节和高语义真实感的图像和字幕。在图像重建和图像字幕生成方面,UniBrain 在定性和定量方面都优于现有方法,并首次在自然场景数据集(NSD)上报告了图像字幕生成结果。此外,消融实验和感兴趣区域(ROI)分析进一步展示了 UniBrain 的优越性,并为视觉诱发脑解码提供全面的见解。
Aug, 2023
介绍了一个两阶段的 fMRI 表示学习框架,通过在预处理阶段使用 Double-contrastive Mask Auto-encoder 降噪,并在第二阶段利用图像自动编码器的指导来调整特征学习者,以关注对于视觉重建最有信息的神经激活模式。使用这种优化后的 fMRI 特征学习者条件下的潜在扩散模型重构图像刺激,实验结果证明该模型在生成高分辨率和语义准确的图像方面的优越性,50 种不同目标的情境下,top-1 语义分类的准确率比先前最先进的方法提高了 39.34%。
May, 2023
本研究通过采用电脑脑波数据对 ImageNet 数据集中的图像进行分类和重建,提出了一种创新的方法。该研究不仅可以从神经活动中解码图像,还能仅利用脑电波数据生成图像的可靠重建,为个性化迅速反馈实验铺平了道路。
Sep, 2023
本文提出了一种名为 MindEye 的新型 fMRI 到图像转换方法,通过对比学习和扩散优先使用两个并行子模块来实现图像的检索和重建,将 fMRI 脑活动映射到高维多模态潜在空间,使用生成模型从该潜在空间接受嵌入以进行图片重建和精确检索。通过实验证明 MindEye 在重建和检索任务方面具有最先进的性能。
May, 2023
利用条件生成扩散模型对大脑活动中的语义描述符进行可视化重建,有效改善了搜索策略,同时保持了低级图像细节的精细度和语义信息的一致性,并且发现该过程的收敛时间与视觉皮层的区域差异有关。
Apr, 2023