MMOct, 2021

HowSumm:基于 WikiHow 文章的多文档自动摘要数据集

TL;DR本篇文章提出了 HowSumm 这一全新的数据集,可用于针对查询的多文档摘要 (qMDS) 任务,其目标是从一组来源生成可操作的指令。通过从 wikiHow 网站文章和它们引用的来源中提取数据创建了该数据集,并讨论了与其他摘要语料库的不同之处,实验结果表明,提取式和抽象式摘要模型在该数据集上的性能仍有提升空间。