Aug, 2022

法国方言的数据收集与分析

TL;DR本文探讨了创建和分析用于数据挖掘和文本分析研究的新数据集,为利兹大学国家方言语料库的联合研究项目做出了贡献。研究使用机器学习分类器对各个法语国家的法语方言文本样本进行分类,并遵循 CRISP-DM 方法论的步骤对数据进行了采集、质量问题和文本分析数据转换的探索。最后,在应用适当的数据挖掘技术后,讨论了评估方法、最佳特征和分类器以及结论。