Aug, 2023

NBIAS:文本中的偏见识别的自然语言处理框架

TL;DR通过开发一个全面而健壮的框架 “Nbias”,我们能够检测和消除文本数据中的偏见,以确保数据的公正和道德使用。该框架包括数据层、语料库构建、模型开发层和评估层,并应用了基于 transformer 的标记分类模型识别具有独特命名实体的偏见词语 / 短语。通过定量和定性评估的混合方法,我们取得了 1% 至 8% 的准确率改进,同时还能全面理解模型的性能,捕捉其数量数据以及质量和复杂性的特征。该方法适用于各种偏见,并促进了文本数据的公正和道德使用。