CVPRApr, 2024
大规模语言模型在视频摘要预训练中的扩展
Scaling Up Video Summarization Pretraining with Large Language Models
Dawit Mureja Argaw, Seunghyun Yoon, Fabian Caba Heilbron, Hanieh Deilamsalehy, Trung Bui...
TL;DR利用大型语言模型生成大规模的视频摘要数据集,提出了一种新的视频摘要模型,并呈现了一个由专业人员注释的高质量摘要的基准数据集,实验证明该方法在多个基准测试中达到了最新的最佳效果。