BriefGPT.xyz
Ask
alpha
关键词
llmeval
搜索结果 - 2
OpenFactCheck:面向 LLMs 的事实性评估统一框架
基于大型语言模型(LLMs)的事实性评估框架 OpenFactCheck,包括自定义自动事实检查器 CUSTCHECKER、多角度评估 LMM 事实性的统一评估框架 LLMEVAL 和使用人工标注数据集评估自动事实检查器验证结果可靠性的 C
→
PDF
2 months ago
LLMEval:大型语言模型评估初探
最近,大型语言模型的评估已成为一个热门的研究领域。本文分析了不同评估方法,比较了各种标准和评分系统,在多个任务和测试中使用了不同的评估者和评分方法,提出了一个新的数据集 LLMEval,并对 20 个大型语言模型进行了评估,得出了 10 个
→
PDF
7 months ago
Prev
Next