Feb, 2017

大规模文本语料库中的自动短语挖掘

TL;DR该论文提出了一种基于知识库的自动短语挖掘框架 AutoPhrase,利用大规模高质量短语取代昂贵的人工规则以及标注,通过浅层句法分析模型和词性标注进一步提高性能,可适用于任何语言。在不同领域和语言的五个真实数据集上,相比现有的方法,新方法在效果上有显著改善。