BriefGPT.xyz
Ask
alpha
关键词
sampling-then-filtering
搜索结果 - 1
HELMA: 面向大型语言模型的大规模幻想评估基准测试
本研究引入了 Hallucination Evaluation for Large Language Models(HELMA)基准来评估 LLM 的幻觉表现,并提出了基于 ChatGPT 的取样 - 过滤框架来生成大规模的,人类标注的幻觉
→
PDF
a year ago
Prev
Next