May, 2023
基于贝叶斯决策的二维视觉查询定位
Bayesian Decision Making to Localize Visual Queries in 2D
Syed Asjad, Aniket Gupta, Hanumant Singh
TL;DR本文介绍了我们在 EGO4D 2023 视觉查询二维定位挑战赛中采用的方法。我们使用 Transformer 在更高维度上确定相似性并结合来自 Siamese Head 的低维度相似性生成后验概率,最终确定了视觉裁剪和所建议边界框之间的相似性。