Jun, 2023

运用部分标点化文本提升阿拉伯文标点的准确度

TL;DR本文提出了一种名为 2SDiac 的多源模型,该模型可以支持输入中的可选变音符,并引入了一种名为有指导性学习的训练方案,以利用不同级别的随机屏蔽中给定的变音符号。实验结果表明,我们的方法在对非变音文本进行评估时,明显优于基准方法。同时,我们的方法参数数量减少超过 60%,达到了最先进的结果。