BriefGPT.xyz
大模型
Ask
alpha
关键词
adaptive stochastic weight averaging
搜索结果 - 1
自适应随机加权平均
提出了自适应随机权重平均(ASWA)技术,该技术结合了随机权重平均(SWA)和提前停止技术,仅在验证数据集上提高泛化性能时更新模型参数的运行平均值。对于图像分类到知识图谱上的多跳推理等广泛实验中,结果表明 ASWA 在模型和数据集上都能实现
→
PDF
7 days ago
Prev
Next