BriefGPT.xyz
Ask
alpha
关键词
llm-based metrics
搜索结果 - 2
PrExMe!大规模探索开源 LLM 用于机器翻译和摘要评估
LLM 和基于 LLM 的度量方法的稳定性和变异性,探索了不同提示策略影响机器翻译和摘要评估的研究,发现了最稳定的提示模式和潜在限制。
PDF
10 days ago
辩论:基于魔鬼辩护的评估与文本评价
提出了一种基于多智能体评分系统的自然语言生成(NLG)评估框架 DEBATE,通过引入反对者的概念,解决了 LLM 智能体回答中的偏见问题,从而在 NLG 评估中显著超越了现有的方法。
PDF
2 months ago
Prev
Next