BriefGPT.xyz
Ask
alpha
关键词
halluqa
搜索结果 - 1
评估中文大型语言模型中的幻觉
在这篇论文中,我们建立了一个名为 HalluQA 的基准,用于衡量中文大型语言模型中的幻觉现象。HalluQA 包含 450 个精心设计的对抗性问题,涵盖多个领域,并考虑了中国的历史文化、习俗和社会现象。我们在构建 HalluQA 过程中考
→
PDF
9 months ago
Prev
Next