ACLJun, 2024

加强符号绑定使得大型语言模型可靠的多选选择器

TL;DR本文研究了大型语言模型中多项选择题的选择偏差问题,提出了一种基于点对点反馈的有效 SFT 算法(PIF),通过提高模型对选项内容的理解能力,显著减少了选择偏差,提高了多项选择题的准确性。