BriefGPT.xyz
大模型
Ask
alpha
关键词
evaluating large language models
搜索结果 - 1
融合评估器与 LLMs:Fusion-Eval
利用大型语言模型进行评估的新方法 “Fusion-Eval” 在 SummEval 数据集上取得了 0.96 的 Spearman 相关性,超过了其他评估方法,在 LLM 评估领域树立了新的标准。
PDF
8 months ago
Prev
Next