Mar, 2024

教师 - 学生训练用于去偏:大型语言模型的一般排列去偏

TL;DR本论文研究了使用蒸馏技术将计算密集的、被消除偏见的教师模型的功能提炼到更紧凑的学生模型中,通过两种学生模型的探索,一种基于纯蒸馏的模型,另一种基于纠错方法用于更复杂的任务,学生模型纠正教师模型的单个有偏决策以达到无偏结果,并证明较小、仅编码器的学生模型在参数数量显著较少的情况下能够胜过较大、有偏的教师模型,取得更好的结果。