CVPRDec, 2021

ScanQA: 三维问题回答用于空间场景理解

TL;DR通过学习语言表达与三维场景的地理特征相关的学习描述符,我们提出了一种基线模型(ScanQA),用于在三维环境中执行基于对象的问题回答,并构建了一个新的 ScanQA 数据集,其中包含来自 800 个室内场景的 40,000 个问题答案对。