Apr, 2023

Q2ATransformer: 通过答案查询解码器提高医学 VQA

TL;DR本文提出了一种名为 Q2ATransformer 的新型 Transformer 框架,将分类和生成方法的优势相结合,为医学图像问题回答系统提供了一种统一的处理方式。通过将可学习的候选答案嵌入到 Transformer 解码器中,使得我们的方法能够像生成方法一样与答案信息交互进行预测,同时通过分类方法减少搜索空间,从而实现了在两个医学 VQA 基准测试上的新的最高性能