Jul, 2024

KeyVideoLLM:面向大规模视频关键帧选择

TL;DR通过基于文本-视频帧相似度的关键帧选择方法,KeyVideoLLM能够高效、鲁棒、有效地管理VideoLLM数据,并在视频问答任务中显著改善模型性能,实验结果一直保持在最新技术的前沿。