Jul, 2023

基于交通领域的自动字幕视频问答

TL;DR论文提出一种名为 TRIVIA 的新方法,将交通领域的知识融入到大型视频语言模型中,通过弱监督技术实现交通领域的视频问题回答,与传统设置相比,提高了代表性视频语言模型的准确率 6.5 个百分点(19.88%)。