COLINGNov, 2020
深度标声符号化:用于改进阿拉伯语标声符号化的高效分层循环
Deep Diacritization: Efficient Hierarchical Recurrence for Improved Arabic Diacritization
Badr AlKhamissi, Muhammad N. ElNokrashy, Mohamed Gabr
TL;DR本文提出了一种针对阿拉伯文音标的新型网络结构,使用基于词和字符层级的循环神经网络层级结构和交叉层级的注意力机制,进一步提高了网络的可解释性。使用额外技巧如句子 dropout 和多数投票进一步提高了模型性能,使得在 Tashkeela 阿拉伯文音标数据集上达到了相对误差减少 30.56% 的 5.34% WER,超过了之前最优结果。