Jul, 2023

是否可信的种族预测?

TL;DR本文利用美国50个州的选民注册数据构建训练集,通过双向长短期记忆(BiLSTM)模型以及综合数据集的方式,比现有文献中的最佳模型的准确率提高了36.8%,同时构建了覆盖面更广、更准确的Bayesian提高姓氏地理编码(BISG)和Bayesian提高名姓地理编码(BIFSG),并提供了第一个高质量的基准数据集,以便公平比较现有模型和帮助未来模型的开发。