Feb, 2023

基于重要性采样的互信息最小化实现文本生成公平性

TL;DR为改善 PLM 在文本生成中的社会偏见,本文提出通过最小化生成文本中的语义与社会偏好之间的互信息,使文本生成中的人口群体提及与其在文本中的描述独立,缓解社会偏见,并通过重要性采样有效估计互信息的上界,最后通过精馏机制将消除偏差后的 PLM 保留其语言建模能力,实验结果表明该方法在公平性和语言建模能力方面具有卓越的性能。