Jun, 2023

基于不相交监督的密集视频目标字幕生成

TL;DR我们提出了一种针对密集视频对象字幕的新任务和模型 - 检测、跟踪和说明视频中所有对象的轨迹。