Jun, 2022

Surgical-VQA: 使用 Transformer 解决手术场景中的视觉问答问题

TL;DR我们设计了一个基于医学图像的手术问答系统,使用视觉和文本转换模型,并通过两个 Surgical-VQA 数据集验证了所提出的方法,结合分类和基于句子的答案以回答关于手术程序的问卷调查。