Jun, 2023

MultiSum:用于视频的多模式摘要和缩略图生成的数据集

TL;DR通过创建包含视频和文本内容的人工验证摘要、17 个主分类和 170 个子分类的全面的数据集 MultiSum dataset,本文针对现有公共 MSMO 数据集的限制进行研究,进行了基准测试,并推出了数据收集工具和开放源代码资源以促进透明度和加速未来发展。