Dec, 2023
USTHB 参加 NADI 2023 共享任务:探索阿拉伯方言识别的预处理和特征工程策略
USTHB at NADI 2023 shared task: Exploring Preprocessing and Feature Engineering Strategies for Arabic Dialect Identification
Mohamed Lichouri, Khaled Lounnas, Aicha Zitouni, Houda Latrache, Rachida Djeradi
TL;DR该研究针对阿拉伯方言识别的国家级方言识别这一子任务,对表面预处理、形态预处理、FastText 向量模型和 TF-IDF 特征的加权拼接等多个关键因素进行深入分析,使用线性支持向量分类(LSVC)模型进行分类,并取得了显著成果,F1 得分为 62.51%,接近于该子任务所提交其他系统的平均 F1 得分 72.91%。