Aug, 2024

超越炒作:对医疗场景中的视觉语言模型的冷静分析

TL;DR本研究针对大型视觉语言模型(LVLMs)在医疗领域的评估不足问题,提出了RadVUQA,一个新的放射学视觉理解与问答基准,以全面评估现有的LVLMs。研究发现,无论是通用LVLMs还是医疗特定的LVLMs,在多模态理解和定量推理上均存在显著缺陷,显示出与临床实际之间的巨大差距,强调了开发更强大智能LVLMs的迫切需求。