Jun, 2024

Vript: 一部视频胜过千言万语

TL;DR通过使用 Vript 数据集,我们提出了 Vriptor 模型,它是一个功能强大的视频字幕生成模型,能生成密集详细的长视频字幕;此外,我们还介绍了 Vript-Hard,一个包含三个更具挑战性视频理解任务的基准测试集。