MMAug, 2023

流式视频中的时间语句定位

TL;DR该研究旨在解决一项新颖任务 —— 流媒体视频中的时间句子定位,通过提出 TwinNet 结构和语言引导的特征压缩器,该方法在多个数据集上进行了广泛实验证明了其卓越性能。