Jun, 2019
PKUSEG:多领域中文分词工具包
PKUSEG: A Toolkit for Multi-Domain Chinese Word Segmentation
Ruixuan Luo, Jingjing Xu, Yi Zhang, Zhiyuan Zhang, Xuancheng Ren...
TL;DR本文提出了一个新的工具包 ——PKUSEG,用于多领域中文分词。PKUSEG 通过提供不同领域的独立模型来达到多领域分词的目的,还提出了一个领域自适应模型来为缺乏标签数据的领域提供分词模型。该工具包具有高性能,支持词性标注和模型训练,可适应各种应用场景。