EMNLPOct, 2022

俄语语言可接受性语料库 (RuCoLA)

TL;DR该研究介绍了由语言学出版物和生成模型构建的 Russian Corpus of Linguistic Acceptability (RuCoLA), 通过基线方法精细分析了接受度分类实验,表明在检测形态和语义错误方面,最广泛使用的语言模型仍然远远落后于人类。研究团队开放了 RuCoLA、实验代码和公共排行榜,以评估俄语语言模型的语言能力。