ACLMar, 2022

EnCBP: 英语中更细粒度的文化背景预测的新基准数据集

TL;DR本文介绍了如何通过 EnCBP 数据集中的语言建模评估和人工分析,证实英语五个说话国家和美国四个州之间存在明显的语言差异。在 CoNLL-2003、PAWS-Wiki、QNLI、STS-B、RTE、SST-5、SST-2、情感和 Go-Emotions 等任务上的评测表明,引入文化背景信息明显提高了深度学习模型在大多数任务上的性能。