CVPRMar, 2022

Bridge-Prompt: 论说明视频中的序数动作理解

TL;DR本文提出了基于 Bridge-Prompt(Br-Prompt)的框架,使用文本提示来模拟相邻行为之间的语义,并通过对比方法共同训练文本编码器和视频编码器。Br-Prompt 在几个视频数据集上均取得了最先进的成果。