BriefGPT.xyz
Ask
alpha
关键词
judge model
搜索结果 - 1
使用大规模知识图谱评估大型语言模型的真实性
提出了 GraphEval 方法使用大规模测试数据集来评估大型语言模型的性能,该方法通过从包含 1000 万多个事实的大型知识图中检索测试数据集来简化评估过程,并创造了一个判断模型来估计语言模型所给出答案的正确性。实验证明判断模型的事实评估
→
PDF
3 months ago
Prev
Next