May, 2024

停!瑕疵之名: NLP 中解析个人姓名和社会人口属性

TL;DR个人姓名同时区分个体并按一定方式进行分类,这对于一个特定的社会来说非常重要。然而,自然语言处理领域在不同任务中将个人姓名与社会人口特征联系起来时,研究人员在解决方法学上的问题上参与程度不同。为了指导未来工作,我们提供了有关姓名和命名的跨学科背景知识。然后,我们调查了将姓名与社会人口属性相关联的问题,包括有效性问题(如系统误差、构造效度)以及伦理关切(如危害、差异影响、文化不敏感性)。最后,我们提供了引导性问题和规范建议,以避免在处理自然语言处理中的姓名和社会人口特征时的有效性和伦理问题。