BriefGPT.xyz
Ask
alpha
关键词
factual qa
搜索结果 - 1
EMNLP
通过语义一致性预测大型语言模型的问答性能
我们通过手动创建一个高质量的事实问答近义词语料库,并与先前工作中的其他相关度量标准相结合,以评估现代大型语言模型(LLMs)的语义一致性,以构建和评估一个用于事实问答参考无关性能预测的框架 -- 预测语言模型准确回答问题的可能性。通过对五个
→
PDF
8 months ago
Prev
Next