Oct, 2024

超声波大型中文语言与视觉助手 LLaVA-Ultra

TL;DR本研究解决了现有视觉语言模型在医学视觉问答中特别是中文超声波领域的理解不足的问题。通过引入精细化的适应性视觉语言模型架构和数据冗余处理方法,我们显著提升了对医学视觉语义的识别能力。研究表明,LLaVA-Ultra在三种医学视觉问答数据集中超越了现有最先进模型,展现了良好的效果和适应性。