Dec, 2023

TaCo:基于信息论和可解释性的自然语言处理中的目标概念删除

TL;DR通过嵌入变换消除NLP模型中的隐性信息以减少性别相关联系,同时保留模型的整体性能和功能。