BriefGPT.xyz
Ask
alpha
关键词
considers-the-human evaluation framework
搜索结果 - 1
ACL
ConSiDERS 人类评估框架:重新思考生成式大型语言模型的人类评估
通过借鉴用户体验研究和人类行为心理学等学科的见解,我们在这篇论文中讨论了生成式大型语言模型(LLMs)的人工评估应该是一项跨学科工作,以确保实验设计和结果的可靠性。我们强调了认知偏见如何混淆流畅信息和真实性,以及认知不确定性如何影响评分(如
→
PDF
a month ago
Prev
Next