May, 2023

Cross3DVG: 不同 RGB-D 扫描的跨数据集三维视觉定位基线和数据集

TL;DR该研究提出了一种新的跨数据集三维视觉定位任务 Cross3DVG,创造了一个大规模的包含 63k 个三维对象多样描述的人工注释数据集,研究表明当前三维视觉定位的跨数据集泛化有很大的提升空间,结合 CLIP 的方法可以提高性能。