BriefGPT.xyz
Ask
alpha
关键词
preference evaluation
搜索结果 - 1
再思基于 LLM 的偏好评估
最近,使用大型语言模型(LLM)进行偏好评估已被广泛采用来比较模型回答的优劣。然而,观察到一种严重偏向较长回答的偏差,引发了对这种评估方法可靠性的关注。通过一系列实验,我们设计了这项工作,研究了 LLM-based 偏好评估指标的主要影响因
→
PDF
9 days ago
Prev
Next