BriefGPT.xyz
Ask
alpha
关键词
chateval
搜索结果 - 2
ChatEval:基于多智能体辩论的 LLM 评估器改进
通过多代理辩论框架,构建了一个名为 ChatEval 的多代理裁判团队,用于自主讨论和评估不同模型在开放性问题和传统自然语言生成任务中生成响应的质量,分析结果表明 ChatEval 不仅仅提供文本评分,还提供了模拟人类评估过程以进行可靠评估
→
PDF
a year ago
使用大型语言模型评估聊天的三种方法
本文通过三种不同的方法,基于大型语言模型(LLMs)对于 ChatGPT 响应的逐轮质量进行预测,并使用动态少量样本来改善基准,并分析了其他两种方法的性能并提出未来研究的改进。研究表明,Llama 2 模型正在缩小 ChatGPT 和开源
→
PDF
a year ago
Prev
Next