May, 2023

使用大型语言模型的共形预测在多项选择题回答中的应用

TL;DR探讨如何利用符合性预测方法对大型语言模型进行不确定性量化,以提高其在多选题答题等任务中的可靠性及稳定性。研究发现,符合性预测所估计的不确定性与模型的预测准确性存在密切关联,这一发现可以用于选择性分类及过滤低质量预测结果等下游应用。研究还探讨了符合性预测对于超出问题领域的问题的处理方法。本工作旨在为大型语言模型在安全关键性场景中提供更加可信和可靠的使用保障。