Oct, 2017

复杂词汇识别:数据注释和系统性能挑战

TL;DR本研究重新审视复杂词汇鉴别问题,使用集成分类器研究计算方法能否有效区分复杂和非复杂词汇,并分析分类性能以了解词汇复杂性的挑战性原因,发现大多数系统在 SemEval CWI 数据集上表现不佳,其中一个原因是人类标注方式。