Dec, 2023

阿拉伯文无点表示:分析与建模

TL;DR这篇论文介绍了阿拉伯文无点表示法作为标准阿拉伯文本表示法的一种选择,通过对五个不同的语料库和四种不同的分词技术进行全面分析,探讨了它的潜在影响。同时,我们还通过文本熵计算分析了无点表示法与标准文本的信息密度,并使用各种文本语料库和分词技术构建了统计和神经语言模型,与使用标准阿拉伯文本表示法开发的语言模型进行了比较评估。最后,利用平行语料库,我们对阿拉伯文本与英文文本的文本分析进行了比较,以获取更多的见解。我们的发现揭示了无点表示法在各种自然语言处理任务中的潜在优势,为阿拉伯语自然语言处理的进一步探索铺平了道路。