跨模态 3D 生成自动化人类视觉疾病诊断

May, 2024

跨模态 3D 生成自动化人类视觉疾病诊断

Automating the Diagnosis of Human Vision Disorders by Cross-modal 3D Generation

Li Zhang, Yuankun Yang, Ziyang Xie, Zhiyuan Yuan, Jianfeng Feng...

TL;DR利用人工智能方法将功能性磁共振成像（fMRI）解码为可视的 3D 图像，实现对 fMRI 数据的自动临床分析。

Abstract

Understanding the hidden mechanisms behind human's visual perception is a fundamental quest in neuroscience, underpins a wide variety of critical applications, e.g. clinical diagnosis. To that end, investigating into the →

visual perception neural responses fmri analysis ai 3d visuals

发现论文，激发创造

MinD-3D: 人类大脑高质量三维物体重建

从功能性磁共振成像（fMRI）信号中重建 3D 视觉，引入了 Recon3DMind 任务；使用 360 度全景视频的 fMRI-Shape 数据集支持这一任务；提出了 MinD-3D 三阶段框架，从 fMRI 信号中解码和重建大脑的 3D 视觉信息；通过有效提取与 fMRI 信号中的视觉兴趣区域高度相关的特征，实现了对高语义相关性和空间相似性的 3D 对象的重建，并深入了解人脑的 3D 视觉处理能力。

Dec, 2023

单向脑机接口：人工神经网络将自然图像编码为视觉皮层的 fMRI 反应

通过使用具有视觉和上下文输入的多模态模型 VISION，我们成功预测了人类大脑对自然图像的功能性磁共振成像（fMRI）扫描反应，其准确度超过了现有技术性能 45％，并揭示了不同视觉区域的表征偏差，生成了可实验检验的假设，并形成了可解释的指标将这些假设与皮层功能相关联，为设计和实现视觉皮层功能分析带来了降低成本和时间负担的可能性。通过计算模型的进化，我们的工作表明可能揭示出对视觉皮层的基本理解，并提供可靠的脑机接口的可行方法。

Sep, 2023

基于 3T fMRI 数据和无监督学习的视网膜视觉图像重建

通过无监督生成对抗网络 (GAN) 结合 7T 和 3T 两个不同的 fMRI 数据集，本文提出了一种新的框架来生成改进的 3T fMRI 数据，克服高质量 7-Tesla 数据的稀缺性和 3-Tesla 实验中简短和低质量扫描的挑战，证明了该方法在生成优质输入视觉图像方面相对于在单个主题上进行训练和测试的数据密集型方法的能力。

Apr, 2024

脑形式化：将 MRI 脑功能建模到机器视觉中

通过引入新颖的基于 Transformer 的 Brainformer 方法，分析人类感知系统中 fMRI 模式，并将其作为监督机制应用于机器视觉模型，通过实验证明，在各种图像识别任务中，利用 fMRI 信息可以实现与当前最先进方法相比的潜在结果。

Nov, 2023

脑电波探幽者：从大脑活动中重构复杂图像

本文研究了如何通过结合 fMRI 神经活动信号、图像和图像语义描述来重建复杂的图像场景，使用深度学习模型，并且通过采用预先训练的视觉 - 语言潜在空间编码 fMRI 信号来解决数据稀缺的问题。

Sep, 2022

脑解码：朝着实时重建视觉感知迈进

通过基于高时间分辨率的 MEG 测量脑活动，利用生成型和基础型人工智能系统解码大脑活动，特别是通过功能性磁共振成像 (fMRI) 解码视觉感知，从而在实时应用方面取得了重大进展。

Oct, 2023

DREAM：从逆向人类视觉系统实现视觉解码

DREAM 是一种基于人类视觉系统的基础知识的 fMRI 到图像的重构方法，通过模拟人类感知视觉世界的分层和并行特性来构建逆向路径，利用专门的路径从 fMRI 数据中提取语义、颜色和深度线索。实验证明，该方法在外观、结构和语义的一致性方面优于当前最先进的模型。

Oct, 2023

思维动画化：从缓慢的脑活动中解耦动态自然视觉重建

提出了一种名为 Mind-Animator 的两阶段模型，通过脑活动数据可以重构人类动态视觉，并在三个公共数据集上达到最先进的性能，通过特征解耦和融合，证实了重构视频的神经学解释性。

May, 2024

从脑活动中解码高分辨率图像的对比、关注和扩散

介绍了一个两阶段的 fMRI 表示学习框架，通过在预处理阶段使用 Double-contrastive Mask Auto-encoder 降噪，并在第二阶段利用图像自动编码器的指导来调整特征学习者，以关注对于视觉重建最有信息的神经激活模式。使用这种优化后的 fMRI 特征学习者条件下的潜在扩散模型重构图像刺激，实验结果证明该模型在生成高分辨率和语义准确的图像方面的优越性，50 种不同目标的情境下，top-1 语义分类的准确率比先前最先进的方法提高了 39.34％。

May, 2023

基于人类视觉的 fMRI 时间序列分析，探究观看复杂度不同图像时 BOLD 响应的变化

通过使用 fMRI 时间序列分析，本研究旨在研究人类大脑对不同复杂度图像的神经变化，通过对公开的 BOLD5000 数据集进行图像分类和时间语义分割的实验，以揭示人类大脑在感知图像时 BOLD 信号的波动和变化。

Sep, 2023