BriefGPT.xyz
大模型
Ask
alpha
关键词
llm-based evaluators
搜索结果 - 2
ACL
METAL:面向多语言元评估
我们提出了一个针对多语言情景下 LLMs 作为评估器的端到端评估框架,并创建了一个用于评估 LLM-based 评估器的精心策划的数据集,该数据集覆盖 10 种语言,包含本族语言者对摘要任务的判断。我们比较了基于 GPT-3.5-Turbo
→
PDF
3 months ago
基于大型语言模型的评估器能够解决多语种评估的扩展问题吗?
通过对大型语言模型的评估,本文发现 LLM-based evaluators 在多语言评估方面可能存在偏差,并需要使用本地语言的数据集进行校准。
PDF
10 months ago
Prev
Next