Feb, 2023

机器翻译用于生成命名实体数据集的潜力探索:波斯语和英语之间的案例研究

TL;DR通过将机器翻译应用于英语数据集,本研究聚焦于生成波斯语命名实体数据集。通过实验评估,最高的 F1 分数是 CoNLL 2003 数据集的 85.11%。本研究的结果强调了机器翻译在为低资源语言(如波斯语)创建高质量的命名实体识别数据集方面的潜力,并提供了有关机器翻译在此任务中有效性的见解。此外,此方法可用于增强低资源语言中的数据或创建嘈杂数据以使命名实体系统更加稳健并改进它们。