Oct, 2023
关于部件、姿势和遮挡的3D感知视觉问答
3D-Aware Visual Question Answering about Parts, Poses and Occlusions
TL;DR通过引入3D感知的视觉问答(3D-aware VQA)任务以及相应的数据集Super-CLEVR-3D和模型PO3D-VQA,本论文探索了在视觉场景的三维结构上进行合成推理的挑战性问题,实验证明PO3D-VQA模型在3D感知的视觉问答上取得了显著进展,但与2D视觉问答基准相比仍存在明显的性能差距,显示出3D感知的视觉问答依然是一个重要的开放研究领域。