TiBiX:利用时序信息进行双向X射线和报告生成
本研究提出了一种策略来克服大规模自然 - 医学分布偏移,并使用预先训练的潜在扩散模型在公开可用的胸部X射线(CXR)及其对应的放射学(文本)报告语料库上进行调整,评估了生成的高保真CXR的图像质量和文本 - 图像对齐的能力,并观察到使用数据增强的方式训练动态成像分类器的证据。
Nov, 2022
该论文主要研究了自动放射学报告生成的技术,重点关注了图像编码组件的相对重要性,并在 MIMIC-CXR 数据集上比较了四种不同的图像编码方法,结果表明fine-grained编码优于其他编码方法。
Nov, 2022
本文提出了一种新的方法,通过使用标签机从医学报告中提取比较先前的信息,并将该先前信息整合到基于Transformer的模型中,从而更加真实和全面地生成医学报告。该方法测试表明效果优于之前的最先进模型,提供了一个有前景的方向来弥补医学报告生成中放射科医生和模型之间的知识差距。
May, 2023
本研究提出了一种基于自动医学图像解释的生成式语言模型的方法,用于从胸部X线图像中检测异常区域并生成相应文本,以降低放射科医生在撰写或叙述发现结果方面的工作量。
Jun, 2023
放射学报告是医学扫描内容的详细文本描述。通过引入经过纵向表示学习和句子 - 解剖学丢弃的方法,我们提出了一种整合自动化报告系统的策略,以加快报告速度并实现解剖区域可控的报告生成。
Oct, 2023
我们提出了一种放射学特定的多模态模型,用于从胸部 X 线片 (CXR) 生成放射学报告。我们的工作基于这样一个观点,即大型语言模型可以通过与预训练的视觉编码器对齐来具备多模态能力。在自然图像上,这已被证明可以使多模态模型具有图像理解和描述能力。我们提出的模型 (MAIRA-1) 结合了一个特定于 CXR 的图像编码器和一个基于 Vicuna-7B 的精调大型语言模型,以及基于文本的数据增强方法,以产生具有最先进质量的报告。具体而言,MAIRA-1 在与放射科医生对齐的 RadCliQ 指标和所有考虑的词汇指标上均有显著提高。对模型输出进行手动审核显示出生成报告的流畅性和准确性,同时揭示了现有评估方法未捕捉到的故障模式。更多信息和资源可在项目网站中找到:this https URL。
Nov, 2023
通过循环一致的映射函数和医疗报告自编码,本研究提出了一种创新方法,消除了一致标记模式的需求,提高了数据可访问性,并实现了不兼容数据集的应用,从而在无配对的胸部X射线报告生成中取得了优越的语言和临床指标的结果。
Mar, 2024
通过对Chest X-ray照片的解释和生成自然语言描述,结合高级推理,评估可用于医学报告生成的视觉-语言模型的性能,发现这些模型往往会产生具有自信的语言,从而导致临床解释的减慢。因此,我们开发了一种基于Agent的视觉-语言方法,使用线性探测和短语锚定工具生成基于不确定性的放射学报告,准确定位和描述病理学。通过开发评估平台进行用户研究,结合自然语言处理指标、Chest X-ray基准和呼吸专家的临床评估,我们的结果显示出在AI生成报告的准确性、解释性和安全性方面的相当大的改进。同时,强调需要更大规模的配对(照片和报告)数据集以及数据扩增来解决这些大型视觉-语言模型中的过拟合问题。
Jul, 2024
本研究解决了现有X射线医学报告生成方法在提取有效信息和计算复杂性方面的不足。提出了一种上下文引导的高效生成框架,通过从训练集中检索样本以增强特征表示能力,从而生成高质量的医学报告。实验结果表明,该方法在多个数据集上具有显著的性能提升。
Aug, 2024