Aug, 2023

多教师知识蒸馏下视频中高效的时间句子定位

TL;DR本论文提出了一个基于知识蒸馏的新型高效多教师模型(EMTM),旨在在维持高性能的同时,实现在未修剪视频中检测自然语言查询所描述的事件时间戳的挑战。