May, 2023

边缘居中:基于异常值的毒性检测中受害群体识别

TL;DR提出了基于数据异常值识别的Group-Based Performance Disparity Index (GPDI)方法来测量人工智能对边缘群体的影响,并发现对这些群体最有害的文本表现出比其他文本高达86%的毒性,而模型的性能差距在28%至71%之间。