ACLApr, 2023
针对波斯 - 阿拉伯文脚本的语言识别基准测试 PALI
PALI: A Language Identification Benchmark for Perso-Arabic Scripts
Sina Ahmadi, Milind Agarwal, Antonios Anastasopoulos
TL;DR本文介绍了如何在 Perso-Arabic scripts 中实现语言检测。作者使用了一系列的监督技术来分类句子到他们的语言中,进而提出了一个层次模型来针对那些经常被分类器混淆的语言困境进行解决。实验结果表明了作者们得到的实现是有效的。