探索多模态大型语言模型用于放射学报告错误检查
利用大型语言模型 (LLM) 开发了多模态大型语言模型来解释胸部 X 射线图像,并研究了提示工程和模型参数对其效果的影响。通过对数据集进行预训练和微调,该模型在胸部 X 射线图像解释中显示了很好的潜力。
Oct, 2023
利用生成性人工智能进行医学图像的放射学报告撰写可极大地减少了时间成本和错误率。本研究中,我们提出了一个简单而有效的两阶段微调方案,通过软性视觉提示将视觉特征与大型语言模型的文本嵌入空间对齐。我们的框架在没有领域特定预训练的情况下取得了最先进的性能,并对软性视觉提示和注意力机制进行了详细分析,为未来的研究方向提供了启示。
Dec, 2023
Radiology-Llama2 是一个基于 Llama2 体系结构的大型语言模型,通过指令调整的过程在放射学领域达到了最先进的性能,它可以根据放射学检查结果生成连贯且临床有用的印象。
Aug, 2023
利用模块化方法针对医学领域使用开源小型多模态模型来解决大规模基础模型在临床需求中存在的问题,并在放射学成像中展示了 LLaVA-Rad 模型的最新结果和其在报告生成和跨模态检索中的性能优势,成为真实世界临床应用的前景工具。
Mar, 2024
临床放射学报告中的错误更正方法研究,利用大型语言模型(LLMs)和检索增强生成(RAG)技术,通过内部和外部检索机制从报告和外部知识源中提取相关医学实体和关系,并引入三阶段推理过程,将任务分解成错误检测、定位和更正子任务,从而提高了系统的可解释性和性能,并通过由领域专家指导的对真实世界放射学报告进行真实错误损坏的基准数据集进行了评估,实验结果表明了所提方法的优势,通过内部和外部检索的结合显著提高了各种最先进的 LLMs 在错误检测、定位和更正方面的准确性,研究结果有助于为临床文档制定更健壮可靠的错误更正系统。
Jun, 2024
该研究提出了一种包括多步骤评估法的大型语言模型(LLM)评估范例,通过结构化的交互方式进行多模态 LLM 评估,并通过获取交互数据进行后续领域特定的分析,以提高其准确性和实用性。研究以 GPT-4-Vision-Preview 为 LLM,使用多模态多项选择题评估其在病理学领域的医学诊断准确性,结果表明其约有 84% 的正确诊断,同时通过进一步的分析揭示了其在特定领域的不足之处。该方法和结果不仅适用于 GPT-4-Vision-Preview,还可应用于评估其他 LLMs 的准确性和实用性,以进一步优化其应用。
Jan, 2024
在本文中,我们介绍了 MID-M 这一创新框架,利用通用领域的大规模语言模型(LLM)的上下文学习能力,通过图像描述来处理多模态数据,其在性能上与任务特定的精调 LLMs 和其他通用领域的 LLMs 相当或更为出色,无需广泛域特定训练或多模态数据的预训练,参数更少,突出了利用通用领域 LLMs 进行领域特定任务的潜力,并为传统 LMM 发展提供了可持续和经济高效的替代方案。此外,MID-M 对于数据质量问题的稳健性证明了其在实际医学领域应用中的实用性。
Apr, 2024
研究了 8 种大型语言模型对放射学报告印象进行总结的能力,使用 CT、PET-CT 和超声波报告构建零、一、三次扫描提示,并定义了五项人工评价指标以评估印象的语义,结果显示大型语言模型在完整性和正确性方面表现较好,但简洁性和真实性评分不高,并指出少量扫描提示可以提高模型的简洁性和真实性,但临床医师仍认为大型语言模型不能取代放射学家的总结能力。
Jun, 2024