Oct, 2022

波斯 - 阿拉伯文的书写规范化

TL;DR本文讨论了波斯 - 阿拉伯文字在自然语言处理方面的挑战,强调了正规化对于脚本变异的重要性,并对 8 种语言的机器翻译和统计语言建模任务的性能进行了评估。结果表明,大多数条件下应用正规化可以显着提高性能,并指出了在语言资源匮乏的情况下,更好地理解和呈现区域正字传统内波斯 - 阿拉伯脚本变化对于现代计算机自然语言处理技术的进一步发展至关重要