ICLRFeb, 2024

从互联网视频中学习通用图像匹配器的方法

TL;DR提出了 GIM:一个基于互联网视频的自我训练框架,通过结合标准领域特定数据集和互补匹配方法,在新的视频中创建密集标签,并通过强化增强的传播数据来训练单一通用模型,能够提高跨领域图像匹配的零样本性能。同时,引入了 ZEB 作为图像匹配的首个零样本评估基准。