Jul, 2023

SACReg: 场景无关的坐标回归视觉定位

TL;DR在这篇论文中,我们提出了一种新的范式,即训练一个单一的通用场景坐标回归模型,然后将其部署到新的测试场景中,无论其规模如何,也无需进一步微调。该模型基于转换器架构,可以接受可变数量的图像和稀疏的 2D-3D 注释作为输入,并在一些多样的数据集上进行训练,显著优于其他场景回归方法,包括针对视觉定位的特定场景模型,并在剑桥定位基准测试中创造了新的最佳表现,甚至超过基于特征匹配的方法。