CVPRMar, 2022

UMT: 统一多模态 Transformers 用于联合视频片段检索和亮点检测

TL;DR本研究提出了一个名为 UMT 的统一多模态转换器的框架,能够实现时刻检索和精华视频检测的联合优化,并且能够轻松地退化为解决单个问题。实验结果表明,该方法在各种设置下都具有有效性、优越性和灵活性。