BriefGPT.xyz
Ask
alpha
关键词
power law metrics
搜索结果 - 1
MM
不使用训练或测试数据预测最先进神经网络质量趋势
该研究利用基于规范的容量控制指标和基于幂律的重尾自正则化理论的度量方法对数百个公开可用的预训练模型进行了详细的元分析,发现基于幂律的度量方法可以更好地区分预训练模型的良好培训和质量低劣的模型。
PDF
4 years ago
Prev
Next