Jan, 2021

CLiMP: 一个汉语语言模型评估基准

TL;DR介绍了汉语语言模型所获得的知识的研究方法。使用汉语语言的最小对称集构建数据集,评估 11 种不同的语言模型。结果显示,汉语 BERT 在平均精度达到 81.8%,而 LSTM 和 5-grams 的性能仅略高于随机水平。