Mar, 2022

高字内复杂度的神经词元分割

TL;DR提出了一种结合了上下文化词元表示和字符级解码的神经分割模型,对于具有高令牌内部复杂性和极度形态歧义的希伯来语和阿拉伯语等语言,其分割准确性得到了显着提高,并对下游NLP任务的表现进行优化。