Jun, 2022
RuCoCo:一个新的俄语语料库,带有指代标注
RuCoCo: a new Russian corpus with coreference annotation
Vladimir Dobrovolskii, Mariia Michurina, Alexandra Ivoylova
TL;DR我们提出了一个带有指代消解注释的新语料库,俄语指代消解语料库 (RuCoCo)。RuCoCo 旨在在保持高注释者一致性的同时获取大量标注的文本。我们的语料库包含了俄语的新闻文本,其中部分是从头开始注释的,而其余部分则是由机器生成的注释被人工注释精细化的。我们的语料库包含了一百万个单词和约 15 万个提及,现已公开发布。