evaluating large language models | BriefGPT

关键词evaluating large language models

搜索结果 - 1

融合评估器与 LLMs：Fusion-Eval
利用大型语言模型进行评估的新方法 “Fusion-Eval” 在 SummEval 数据集上取得了 0.96 的 Spearman 相关性，超过了其他评估方法，在 LLM 评估领域树立了新的标准。
PDF8 months ago