COLINGMar, 2024

利用语料库元数据检测基于模板的翻译:埃及阿拉伯维基百科版本的探索性案例研究

TL;DR通过探索性分析和构建自动检测系统,本文旨在解决埃及阿拉伯维基百科中模板翻译问题,并利用文章元数据构建多变量机器学习分类器来自动检测这些模板翻译文章。最终,将最佳分类器 XGBoost 发布为名为 EGYPTIAN WIKIPEDIA SCANNER 的在线应用,并向研究界提供提取、过滤和标记的数据集,以便从我们的数据集和在线网络检测系统中获益。