BriefGPT.xyz
Ask
alpha
关键词
training types
搜索结果 - 1
LLM 中大规模评估结果的全面重新评估:多方面的统计方法
通过应用 ANOVA、Tukey HSD 测试、GAMM 和聚类技术,本研究对 LLMs 进行了彻底重新审视,针对当前评估方法中的不足之处。我们的研究利用了大量的评估结果数据集,引入了全面的统计方法,为解析 LLM 性能数据提供了一个强大而
→
PDF
4 months ago
Prev
Next