BriefGPT.xyz
Ask
alpha
关键词
llm-based evaluations
搜索结果 - 2
文本生成的更好 LLM 评估器:提示输出排序和优化的影响
通过研究大型语言模型的评估生成文本的提示设计,本研究发现不同提示结构和包含解释性原因的顺序对语言模型评分有重要影响,进而提出了优化评分一致性的方法。
PDF
22 days ago
评估 LLM 申请的挑战:自动、人工和基于 LLM 的方法分析
聊天机器人的评估是一个重要问题,本研究介绍了一种综合评估机制,该机制结合了人类评估和基于 LLM 的评估,并通过实验证明基于因子的评估在 LLM 应用中提供更好的洞察力,进一步加强了在主要功能不是直接检索的关键空间中使用人类评估的论点。
PDF
a month ago
Prev
Next