ACLMay, 2023

DEPLAIN: 一个德语平行语料库,具有针对句子和文档简化的纯语言内译

TL;DR本文介绍了 DEplain,它是一种新的德语数据集,用于在新闻和网络领域中对句子和文档进行平行语言的写作,我们使用该数据集进行训练,使用 transformer-based 的 seq2seq 模型实现文本简化,并通过 web 收集器扩大其数据量以得到更具吸引力的结果。