AAAIDec, 2023

CLIP 和 LLM 在医疗中的多模态问题摘要

TL;DR在现代医疗时代,迅速生成医疗问题摘要对知情和及时的患者护理至关重要。本文介绍了多模态医疗问题摘要(MMQS)数据集,该数据集将医疗查询与图像辅助相结合,便于更丰富、更细致地理解患者需求。我们提出了一个基于 Contrastive Language Image Pretraining (CLIP) 和 Large Language Models (LLMs) 的框架,包括四个模块,用于识别医疗障碍、生成相关上下文、过滤医疗概念和制作具有视觉感知的摘要。通过利用我们的 MMQS 数据集,展示了图像视觉线索如何增强医学细致摘要的生成。这种多模态方法不仅提升了医疗决策过程,还促进了对患者查询的更细致理解,为个性化和响应式医疗护理的未来研究奠定了基础。