Jun, 2024

Vript: 一部视频胜过千言万语

TL;DR通过使用Vript数据集,我们提出了Vriptor模型,它是一个功能强大的视频字幕生成模型,能生成密集详细的长视频字幕;此外,我们还介绍了Vript-Hard,一个包含三个更具挑战性视频理解任务的基准测试集。