Mar, 2024

LITA:语言教导的时域定位助手

TL;DR提出了Language Instructed Temporal-Localization Assistant (LITA)方法,通过引入时间标记、SlowFast标记和强调时序本地化数据,改进了多模态大型语言模型的时序本地化能力,并在Reasoning Temporal Localization (RTL)任务和ActivityNet-RTL数据集中取得了显著的性能提升。