Jun, 2024

文本引导的 3D 视觉定位调查:要素、最新进展与未来方向

TL;DR文本引导的三维视觉定位(T-3DVG)是从复杂的三维场景中定位与语言查询在语义上对应的对象,近年来已经在三维研究领域引起了越来越多的关注。本综述试图全面概述 T-3DVG 的进展,包括基本要素、最新研究进展和未来研究方向,并提供了详细的教程式的管道结构、现有方法的分类和性能评估指标,以及现有方法的潜在限制和未来研究方向。