Jul, 2024

fairBERTs:通过语义和公平感知扰动抹除敏感信息

TL;DR通过生成对抗网络生成语义和公平感知扰动,通过消除受保护敏感信息来学习公平微调的BERT类模型fairBERTs,在维持模型实用性的同时,解决预训练语言模型中存在的刻板偏见和不公平问题。