BriefGPT.xyz
Sep, 2019
BERT遇见中文分词
BERT Meets Chinese Word Segmentation
HTML
PDF
Haiqin Yang
TL;DR
应用BERT模型对中文分词任务进行了探究, 在标注不一致的情况下BERT模型可以稍稍提高性能, 具有良好的特征提取能力, 大模型通常具有更好的性能, 可作为其他神经网络模型的优秀特征候选项, Softmax表现可以不输CRF。
Abstract
chinese word segmentation
(CWS) is a fundamental task for Chinese language understanding. Recently,
neural network-based models
have attained superior performance in solving the in-domain CWS task. Last year,
→