EMNLPAug, 2016

社交媒体中的人口方言差异:非裔美国英语案例研究

TL;DR本文研究表明,虽然方言语言在社交媒体上越来越普遍,但是开发自然语言处理工具的资源很少。本文以推特上的非裔美国英语为案例研究方言语言的实用性。文章提出了一种基于地理位置信息的远距离语言学习模型来识别 AAEL(African-American English like language),并验证了这种语言遵循已知的非裔美国英语语言现象。此外,文章对现有的语言识别和依赖解析工具在 AAEL 文本上的质量进行了分析,证明它们在处理这样的文本时比白人说话者的文本表现差。作者还提供了一种语言识别的整合分类器,消除了这种差异,并发布了一个包含 AAEL 类似语言的新推文语料库。