Jan, 2022

异质图神经网络的中文分词

TL;DR本文提出了一个名为HGNSeg的框架,它利用预训练语言模型和异构图神经网络充分利用多层次的外部信息以提高中文分词的性能,并在六个基准数据集上进行了实验,证明了我们的方法的有效性。尤其是在跨领域情况下,我们的方法还表现出很强的缓解词表外(OOV)问题的能力。