BriefGPT.xyz
Ask
alpha
关键词
iterative training data filtering
搜索结果 - 1
元排名:不太强大的语言模型能够进行单一回应判断
我们提出了一种名为 Meta Ranking (MR) 的新方法,通过比较目标查询 - 响应对与参考查询 - 响应对,使能力较弱的大语言模型能够有效判断个别响应的可靠性,并且在推理任务中实现了出色的误差检测效果,可以用于改进大语言模型的性能
→
PDF
5 months ago
Prev
Next