BriefGPT.xyz
Jul, 2024
CATT:基于字符的阿拉伯语塔什基尔转换器
CATT: Character-based Arabic Tashkeel Transformer
HTML
PDF
Faris Alasmary, Orjuwan Zaafarani, Ahmad Ghannam
TL;DR
通过训练Tashkeel模型,本研究提出了一种新方法来改进阿拉伯文本处理,特别是在语音合成和机器翻译等应用中,通过消除歧义和最小化解释风险,提高对阿拉伯文本的理解能力。通过使用预训练的基于字符的BERT模型初始化,应用Noisy-Student方法提升了模型的性能,并通过实验证明其在ATD领域的最新成果。
Abstract
tashkeel
, or
arabic text diacritization
(
atd
), greatly enhances the comprehension of Arabic text by removing ambiguity and minimizing the
→