Jun, 2020

自动摘要俄罗斯新闻的数据集

TL;DR本文介绍了 Gazeta 数据集,它是用于俄语新闻报道的第一个自动文本摘要数据集,并对其进行了扩展性和抽象性模型的基准测试和评估。结果表明,该数据集适用于俄语文本摘要任务,并且预训练的 mBART 模型可用于俄语文本摘要。