MMOct, 2021
HowSumm:基于 WikiHow 文章的多文档自动摘要数据集
HowSumm: A Multi-Document Summarization Dataset Derived from WikiHow Articles
Odellia Boni, Guy Feigenblat, Guy Lev, Michal Shmueli-Scheuer, Benjamin Sznajder...
TL;DR本篇文章提出了 HowSumm 这一全新的数据集,可用于针对查询的多文档摘要 (qMDS) 任务,其目标是从一组来源生成可操作的指令。通过从 wikiHow 网站文章和它们引用的来源中提取数据创建了该数据集,并讨论了与其他摘要语料库的不同之处,实验结果表明,提取式和抽象式摘要模型在该数据集上的性能仍有提升空间。