ACLAug, 2018

用神经半马尔可夫条件随机场进行鲁棒的基于字符的词性标注

TL;DR本文提出了一种基于字符级别的新型端到端模型,不需要分词器,采用半隐马尔可夫条件随机场和神经网络的结合,证明了其在多语言环境和存在嘈杂的 token 边界下的高效性。在嘈杂的英语词性标注基准数据集上,我们的模型明显优于同类模型,并和现有技术方法取得了一致的表现。