ACLNov, 2020

Liputan6:一个用于文本摘要的大规模印度尼西亚数据集

TL;DR本文介绍了一个大规模印尼文摘要数据集,使用预训练语言模型开发了基于 BERT 多语言和单语言的抽取式、生成式摘要方法,并通过对 ROUGE 得分较低的机器生成摘要进行了彻底的误差分析,揭示了 ROUGE 本身以及抽取式、生成式摘要模型的问题。