BriefGPT.xyz
Ask
alpha
关键词
generative conversational large language models
搜索结果 - 1
再问一次,然后失败:大型语言模型在判断中的摇摆
利用教育中的质问策略,我们提出了一种 “跟进质问机制” 以及两个评估指标,用于评估大型语言模型在面对质疑时的判断一致性,并对 ChatGPT、PaLM2-Bison 和 Vicuna-13B 进行了评估。实证结果表明,即使初始答案是正确的,
→
PDF
9 months ago
Prev
Next