May, 2023

基于贝叶斯决策的二维视觉查询定位

TL;DR本文介绍了我们在 EGO4D 2023 视觉查询二维定位挑战赛中采用的方法。我们使用 Transformer 在更高维度上确定相似性并结合来自 Siamese Head 的低维度相似性生成后验概率,最终确定了视觉裁剪和所建议边界框之间的相似性。