COLINGMar, 2020
NYTWIT: 纽约时报中的新词语数据集
NYTWIT: A Dataset of Novel Words in the New York Times
Yuval Pinter, Cassandra L. Jacobs, Max Bittker
TL;DR本研究介绍 New York Times Word Innovation Types dataset(NYTWIT)数据集,包括超过 2500 个英语新词汇,手动标注其创新类型,希望为语言学家和 NLP 从业者提供新词汇出现的真实环境,并且展示了对于 NLP 系统的非上下文和上下文预测的基线结果,表明仍有提高空间。