BriefGPT.xyz
Ask
alpha
关键词
many-shot in-context prompts
搜索结果 - 1
能否在长上下文中使用多样本情境学习来帮助 LLM 法官?更多观察,更好判断!
使用大型语言模型作为评判器评估大型语言模型的性能,可能引入潜在的偏见,并对评估结果的可靠性提出关切。为了缓解这个问题,我们提出和研究两种版本的多示例上下文提示(加强和无监督),以帮助 GPT-4o 作为评判器进行单答案打分。基于设计的提示,
→
PDF
23 days ago
Prev
Next