Feb, 2022

从维基百科修订历史中挖掘自然形成的纠错和改写

TL;DR通过 Wikipedia 修订历史创建的 WiCoPaCo(Wikipedia 纠正和改写语料库)是一个重要的资源,它包含了人工编辑的大量文本修正和改写,对于训练、评估自动处理文本的过程以及语言研究都非常有用,本文介绍了 WiCoPaCo 的主要动机、构建方式和在法语方面的初步应用。