BriefGPT.xyz
大模型
Ask
alpha
关键词
g-eval
搜索结果 - 1
EMNLP
大规模语言模型在自动评估中的深入研究
使用大型语言模型(LLMs)评估文本质量近来变得流行。本文分析了 LLM 评估(Chiang 和 Lee,2023)和 G-Eval(Liu et al.,2023),讨论了评估过程中的细节如何改变 LLMs 给出的评分与人类评分的相关性。
→
PDF
9 months ago
Prev
Next