May, 2021

UCPhrase: 无监督上下文感知质量短语标注

TL;DR本文提出了UCPhrase,一种新型的无监督上下文感知高质量短语标记器,它利用基于上下文一致性的词序列自动提取高质量短语,并通过基于变换器的神经网络和标签共同训练轻量级跨度预测模型识别表面名称或频率不同的高质量短语。该方法在语料库级别短语排名、文档级别关键词提取和句子级短语标记等任务方面,表现优于现有技术。