BriefGPT.xyz
大模型
Ask
alpha
关键词
generative pre-trained transformer 3
搜索结果 - 1
探索大型语言模型在通过思维链路提示进行反思评估方法中的效力
通过 CoT 提示方法来评估四个语言模型对第三年医学生反思性文章的打分,结果显示 Llama-7b 表现最差,均方误差最高,而 ChatGPT 表现出色,科恩卡帕分数达到 0.53。此外,所选模型均优先考虑用户隐私,允许用户删除自己进行的会
→
PDF
9 months ago
Prev
Next