EMNLPSep, 2021

自然语言理解中的去偏方法使得偏见更容易被接受

TL;DR通过提出一种基于探究的框架,研究了自然语言理解中的偏见修正方法。结果表明,推迟偏见的方法会导致更多的偏见被编码到模型的内部表示中。