关键词permutation sensitivity
搜索结果 - 2
- 教师 - 学生训练用于去偏:大型语言模型的一般排列去偏
本论文研究了使用蒸馏技术将计算密集的、被消除偏见的教师模型的功能提炼到更紧凑的学生模型中,通过两种学生模型的探索,一种基于纯蒸馏的模型,另一种基于纠错方法用于更复杂的任务,学生模型纠正教师模型的单个有偏决策以达到无偏结果,并证明较小、仅编码 - 用尴尬简单的排列愚弄您的(视觉和)语言模型
大语言和视觉语言模型广泛应用于实践中,但由于它们在遵循指令、上下文学习等方面的令人印象深刻的能力,迫切需要仔细分析它们的鲁棒性,以便利益相关者了解这些模型在任何特定应用中是否足够可靠。本文重点介绍了流行模型中的一个特定漏洞,即多项选择题回答