Feb, 2025

PitVQA++:用于垂体手术中开放式视觉问答的向量矩阵低秩适应

TL;DR本研究针对手术视觉问答(VQA)领域中数据集有限、过拟合与灾难性遗忘的挑战,提出了PitVQA++和向量矩阵低秩适应(Vector-MoLoRA)方法,创新性地调整GPT-2模型以适应垂体手术。实验结果表明,该方法在Open-Ended PitVQA和EndoVis18-VQA数据集上显著提高了模型性能,并有效减轻灾难性遗忘,增强了应对不确定性预测的可靠性与信任度。