SIGIRMay, 2022

CenterCLIP: 用于高效文本 - 视频检索的 Token 聚类

TL;DR本文介绍了 CenterCLIP,它是一种新的视频标记聚类算法,在减少多余的视频标记、提高视频与文本表示的语义对齐方面表现优异,并取得了比现有最先进方法更好的结果