Feb, 2024

LVCHAT:促进大视频理解

TL;DR通过引入动态调整嵌入数量以适应视频时长的方式,以及重复位置嵌入和交错多组视频以处理超长视频输入的方法,我们提出了 Long Video Chat (LVChat),在长视频问答数据集和长视频字幕基准测试中,实验证明 LVChat 在准确度上优于现有方法高达 27%。