Jun, 2023

通过帕累托最优自我监督实现大型语言模型的自动校准和误差修正

TL;DR本文提出了一种 Pareto 最优的自我监督框架,该框架可以利用可用的程序监督来系统地校准 LLM 响应,为每个响应产生风险分数,从而不需要进行任何额外的人工努力。