BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-modal 3d scene understanding
搜索结果 - 2
多模式三维场景理解的最新进展:综合调研和评估
本文对多模态 3D 场景理解的最新进展进行了系统调查,介绍了各种多模态任务的背景和困难,分类了现有方法,并对它们的优势和限制进行了探索,提供了在几个基准数据集上的对比结果和深入分析,最后讨论了未解决的问题并提出未来研究的几个潜在方向。
PDF
8 months ago
ICCV
Multi3DRefer: 文本描述与多个 3D 对象的关联
我们介绍了使用自然语言描述来定位现实世界 3D 场景中多个对象的任务。我们提出了 Multi3DRefer,扩展了 ScanRefer 数据集和任务,并引入了新的评估指标和基准方法以进一步研究多模态 3D 场景理解。此外,我们利用 CLIP
→
PDF
10 months ago
Prev
Next