Jun, 2023
通过帕累托最优自我监督实现大型语言模型的自动校准和误差修正
Automatic Calibration and Error Correction for Large Language Models via Pareto Optimal Self-Supervision
Theodore Zhao, Mu Wei, J. Samuel Preston, Hoifung Poon
TL;DR本文提出了一种 Pareto 最优的自我监督框架,该框架可以利用可用的程序监督来系统地校准 LLM 响应,为每个响应产生风险分数,从而不需要进行任何额外的人工努力。