Sep, 2022

一个新的对齐的简单德语语料库

TL;DR该研究介绍了一种名为‘Leichte Sprache’的德国简易语言,致力于使复杂的书面语言更易理解。研究团队通过自动化句子对齐,创建了一份包含多个文档源的新的德语单语语料库,并在参考手动标记的子集下评估了对齐的质量。评估结果表明,该方法的 F1 得分优于以前的工作,并已发布 BY-SA 许可的数据集及用 MIT 许可发布的相关代码。