May, 2024

AraSpell:一种用于阿拉伯语拼写纠正的深度学习方法

TL;DR使用不同的 seq2seq 模型架构(如递归神经网络(RNN)和 Transformer)和人工数据生成进行错误注入,本研究介绍了一种用于阿拉伯语拼写纠正的框架 AraSpell,并通过彻底的实验研究提供了所提方法的有效性的经验论据,其与标记数据相比,词错误率(WER)和字符错误率(CER)分别达到了 4.8% 和 1.11%,与标记数据相比,CER 分别为 2.9%,WER 为 10.65%。这些结果都是在一个包含 100K 个句子的测试集上获得的。