Apr, 2023

ViewFormer: 多视角三维形状理解的视图集合注意力

TL;DR本研究为多视角三维形状识别和检索提出了 ViewFormer 方法,该方法通过提出 “视角集” 视角,采用一种自适应的注意力模型来捕捉视图集中的元素之间的成对和高阶相关性,并将学习到的多视角相关性聚合到一个富有表达力的视角集描述符中进行识别和检索。实验证明,该方法在不同任务和数据集上具有惊人的能力。特别是在 ModelNet40 数据集上,ViewFormer 首次达到 98.8%的识别准确率,超过了之前最好的方法 1.1%的表现。