ACLNov, 2020
Liputan6:一个用于文本摘要的大规模印度尼西亚数据集
Liputan6: A Large-scale Indonesian Dataset for Text Summarization
Fajri Koto, Jey Han Lau, Timothy Baldwin
TL;DR本文介绍了一个大规模印尼文摘要数据集,使用预训练语言模型开发了基于 BERT 多语言和单语言的抽取式、生成式摘要方法,并通过对 ROUGE 得分较低的机器生成摘要进行了彻底的误差分析,揭示了 ROUGE 本身以及抽取式、生成式摘要模型的问题。