ACLJun, 2022

基于在线数据库的词汇性别推理方法研究

TL;DR本文介绍了一种自动检测大型语言数据集中具有词汇性别的单词的新方法,以解决手动编译性别化表达的词汇列表的静态问题和无法在分析范围之内的单词问题。该方法是基于字典的,可提供动态的、更新至最新的高覆盖分析,并在随机可获取的维基百科示例中达到了 80%的准确率,在以前的研究中使用的性别化词汇列表测试时也表现良好。