COLINGMar, 2020

NYTWIT: 纽约时报中的新词语数据集

TL;DR本研究介绍 New York Times Word Innovation Types dataset(NYTWIT)数据集,包括超过 2500 个英语新词汇,手动标注其创新类型,希望为语言学家和 NLP 从业者提供新词汇出现的真实环境,并且展示了对于 NLP 系统的非上下文和上下文预测的基线结果,表明仍有提高空间。