EMNLPDec, 2022

NarraSum:大规模抽象叙述摘要数据集

TL;DR该论文提出了一个名为 NarraSum 的大规模叙述性摘要数据集,在多种影视类型中收集了 12.2 万个叙述文档及其对应的提取式摘要。实验证明,与最先进的摘要模型相比,人类在 NarraSum 上存在较大的性能差距。我们希望该数据集能够促进未来的摘要研究以及自然语言理解和生成的更广泛研究。