Jan, 2021
CLiMP: 一个汉语语言模型评估基准
CLiMP: A Benchmark for Chinese Language Model Evaluation
Beilei Xiang, Changbing Yang, Yu Li, Alex Warstadt, Katharina Kann
TL;DR介绍了汉语语言模型所获得的知识的研究方法。使用汉语语言的最小对称集构建数据集,评估 11 种不同的语言模型。结果显示,汉语 BERT 在平均精度达到 81.8%,而 LSTM 和 5-grams 的性能仅略高于随机水平。