跨模态原型驱动网络用于放射学报告生成

ECCVJul, 2022

跨模态原型驱动网络用于放射学报告生成

Cross-modal Prototype Driven Network for Radiology Report Generation

Jun Wang, Abhir Bhalerao, Yulan He

TL;DR本文介绍一种名为 XPRONET 的交叉模态原型驱动的网络来生成放射学报告，并在 IU-Xray 和 MIMIC-CXR 基准测试中实现了与最新技术相比显著的改进和相当的表现。

Abstract

radiology report generation (RRG) aims to describe automatically a radiology image with human-like language and could potentially support the work of radiologists, reducing the burden of manual reporting. Previous approaches often adopt an encoder-decoder architecture and focus on sing

radiology report generation cross-modal prototype driven network multi-label prototype learning iu-xray benchmark mimic-cxr benchmark

发现论文，激发创造

跨模态记忆网络用于放射学报告生成

本文提出了一种跨模式记忆网络 (CMN) 来增强医学影像学中放射学报告自动生成的编码器 - 解码器框架，实验结果表明该模型能够更好地对齐放射图像和文本信息，具有更高的临床指标准确性。

Apr, 2022

超越图像：胸部 X 光片报告生成的综合多模态方法

通过结合结构化患者数据和非结构化临床记录，我们提出了一种新颖的多模态深度神经网络框架，用于生成描述医学图像结果的胸部 X 射线检查报告，并通过引入条件交叉多头注意力模块来融合这些异构数据模态，弥合视觉和文字数据之间的语义差距。与仅依赖图像的模型相比，实验证明通过使用附加模态可以显著改善结果，在 ROUGE-L 指标上达到了文献相关最高的性能。此外，我们采用了人工评估和临床语义相似度测量以及词重叠度指标来提高定量分析的深度。由经过认证的放射科医师进行的人工评估确认了该模型在识别高级结果方面的准确性，但也强调需要更多的改进以捕捉细微的细节和临床背景。

Nov, 2023

基于多视图影像融合和医学概念增强的自动放射学报告生成

提出了一种基于深度学习技术的生成式编码解码模型，通过对大量胸部 X 光图像进行预先训练并提取医疗概念，结合词级别的注意力机制，成功生成精准较为自然的放射学报告。

Jul, 2019

使用非影像数据为条件的 Transformers 生成放射学报告

该研究提出了一种新颖的多模态变压器网络，将胸部 X 光片（CXR）图像与相关的患者人口统计信息相结合，合成特定患者的放射学报告，并通过综合得出的语义文本嵌入和医学图像 - derived 视觉特征的变压器编码器 - 解码器网络，以提高报告生成的质量。

Nov, 2023

利用大模型推动的临床质量强化学习的放射学报告生成

本文介绍了一种新颖的 LM-RRG 方法，它将大型模型与临床质量强化学习相结合，以生成准确和全面的胸部 X 射线放射学报告。通过设计驱动的大型语言模型特征提取器分析和解释胸部 X 射线图像的不同区域，强调具有医学意义的特定区域。基于大型模型的解码器，我们开发了一种多模态报告生成器，利用来自视觉特征和文本指导的多模态提示以自回归方式生成放射学报告。最后，为了更好地反映放射科医生通常在报告中分配的临床重要和不重要的错误，我们引入了一种新颖的临床质量强化学习策略，在学习过程中使用放射学报告临床质量（RadCliQ）指标作为奖励函数。在 MIMIC-CXR 和 IU-Xray 数据集上进行了大量实验，证明了我们方法的优越性。

Mar, 2024

促进学习是否有利于放射学报告生成？

本文介绍了 PromptRRG，一种利用提示学习激活预训练模型并结合先前知识的辅助放射学报告生成方法，并通过对 Prompt 设计的研究将其分为常见提示、领域特定提示和疾病丰富提示等级。在最大的放射学报告生成基准 MIMIC-CXR 上进行的实验结果显示，我们的方法达到了最先进的性能。

Aug, 2023

基于深度学习的放射学报告生成研究的系统综述

深度学习在医学影像的报告生成方面的关键研究进展进行了综述，强调了基于任务特征的方法、视觉和文本信息的综合利用以及跨模态交互对于提高报告生成质量的重要性，并介绍了常用的基准数据集和评估指标，分析了不同方法的性能并展望了未来发展方向。

Nov, 2023

RoentGen: 胸部 X 光图像生成的视觉语言基础模型

本研究提出了一种策略来克服大规模自然 - 医学分布偏移，并使用预先训练的潜在扩散模型在公开可用的胸部 X 射线（CXR）及其对应的放射学（文本）报告语料库上进行调整，评估了生成的高保真 CXR 的图像质量和文本 - 图像对齐的能力，并观察到使用数据增强的方式训练动态成像分类器的证据。

Nov, 2022

多模态图像文本匹配改善基于检索的胸部 X 射线报告生成

本论文介绍了一种新的检索型放射学报告生成模块 Contrastive X-Ray REport Match (X-REM)，其使用语言 - 图像模型计算匹配分数以衡量胸部 X 射线图像和放射学报告的相似性，从而提高基于检索方法的放射学报告的生成效果，优于之前的方法。

Mar, 2023

基于记忆驱动的 Transformer 生成放射学报告

本文提出了使用记忆驱动 Transformer 来生成放射学报告，实验证明该方法可以以更高的质量、更长的长度和更多的医学术语产生放射学报告，此为我们所知第一次在 MIMIC-CXR 上实现放射学报告的生成结果。

Oct, 2020