BriefGPT.xyz
Ask
alpha
关键词
transition analyses
搜索结果 - 1
PertEval: 揭示权知识能力不变扰动下的 LLMs 真实知识容量
通过 PertEval 工具集,利用知识不变的扰动以人类样式修正技巧从静态基准中生成即席测试样本,精确评估 LLMs 真正的知识能力。通过对六个最先进的 LLMs 进行重新评估,结果显示 LLMs 在原始基准上明显夸大性能,其中包括 GPT
→
PDF
a month ago
Prev
Next