Aug, 2023

在混乱的现实场景中使用视觉变换增强地标检测

TL;DR本研究提出了一种能够有效利用视觉 Transformer 的方法,通过精选和隔离图像中与遮挡物相对应的特定区域,以改进视觉地点识别中的地标检测问题,在拥挤的实际情境中显示了视觉 Transformer 的潜力,并证明了该方法的卓越准确性。