BriefGPT.xyz
Ask
alpha
关键词
variance metrics
搜索结果 - 1
测评基准中方差的量化
通过定义和衡量一系列度量评估基准中的方差,包括初始化中的随机性和训练过程中的单调性,本研究提供了对各种方差度量的实证估计,并为从业者提供了考虑和建议。研究发现,简单的改变策略任务(如 MMLU)为较小规模(约 7B)的模型降低了方差,而受人
→
PDF
22 days ago
Prev
Next