BriefGPT.xyz
Ask
alpha
关键词
capability evaluation
搜索结果 - 1
FAC$^2$E:通过区分语言和认知来更好地理解大型语言模型的能力
FAC$^2$E 是一个针对大型语言模型 (LLMs) 的能力评估框架,通过提取 LLMs 的中间推理,将特定能力应用过程分解为三个子步骤,并评估每个细分能力的各个子步骤,从而全面区分 LLMs 的语言相关能力和认知相关能力。利用 FAC$
→
PDF
4 months ago
Prev
Next