Mar, 2024

等级工具:社会等级与自然语言处理性能的相关性

TL;DR我们通过对电影中的 95K 个话语进行社会阶级、种族和地理语言差异的语料库注释,并对语言建模、自动语音识别和语法错误纠正三个任务中 NLP 系统的性能进行了实证研究,发现与社会经济地位、种族和地理差异有关的显著性能差异。随着 NLP 技术的日益普及和日常化,为避免对已经边缘化的群体造成不利影响,它们必须适应所有语言变体。我们主张将社会经济阶级纳入未来的语言技术中。