Jun, 2021

VT-SSum:一个视频转录分割及概要提取的基准数据集

TL;DR本文提出了一个基于视频讲座的英语口语文本摘要的基准数据集 VT-SSum,该数据集包含 9,616 个视频的 125K 个口语文本 - 摘要对,使用该数据集进行的实验结果表明,与 AMI 标准相比,使用 VT-SSum 进行训练的深度学习模型能够显著提高对口语文本的摘要质量。