ECCVDec, 2021

轻量级注意力特征融合:文本到视频检索的新基准

TL;DR本文提出了一种轻量级关注特征融合 (LAFF) 的方法,它旨在通过优化特征的凸组合来实现文本到视频的检索,并且在两端均进行特征融合,大大提高了利用已有特征的能力,并证明其作为文本到视频检索新基准的有效性。