Apr, 2020

注意词形变化!基于词形变化编码改进非标准英语的自然语言处理

TL;DR该论文提出了基于BITE的英文文本分词方法,将屈折词语还原为其基本形式,并通过添加特殊符号重新注入语法信息,提高了NLP模型在非标准屈折形式方面的鲁棒性并保持了在干净数据上的性能。研究者们通过评估提出了度量语料库效率的指标。