Apr, 2025

外科学人工智能中大型视觉-语言模型的系统评估

TL;DR本研究针对外科领域中大型视觉-语言模型(VLMs)在图像理解任务中的实际应用进行了深入分析,弥补了相关文献中对其效用研究的不足。研究发现,VLMs展示出良好的泛化能力,尤其是在使用上下文学习时性能提升显著,表明其适应性是一个关键优势;然而,在空间或时间推理任务上的表现仍然较弱,这为今后在临床及其他实际场景中的应用提供了重要见解。