Aug, 2024
多样化文本提示的可解释性如何影响医学视觉-语言零-shot任务?
How Does Diverse Interpretability of Textual Prompts Impact Medical
Vision-Language Zero-Shot Tasks?
TL;DR本研究解决了现有医学视觉语言预训练模型在面对不同文本提示时的性能不稳定问题。我们系统评估了三种流行的MedVLP方法在15种疾病上的提示敏感性,并发现所有模型在不同可解释性提示下的表现不均匀,揭示了对复杂医学概念理解的困难。这表明需要进一步改进MedVLP方法,以增强其面对多样化零-shot提示的鲁棒性。