ACLMay, 2023

VCSUM:一个多用途的中文会议摘要数据集

TL;DR本研究介绍了一个全面的中文会议记录数据集 (VCSum),包含 239 个真实会议的记录,总时长超过 230 小时,并提供了主题分割、标题、段落摘要、总结摘要和关键语句的注释。研究分析确认了该数据集在会议记录摘要方面的有效性和稳健性,并提供了一组关于 VCSum 不同 downstream 摘要任务的基准模型,以促进进一步研究。