May, 2022

通过问问题学习检索视频

TL;DR提出了一种具备多轮对话交互能力的视频检索框架,该框架包括 AI agent、多模态问答生成器及信息指导监督器,实验表明其效果显著优于传统非交互方式的视频检索系统。