BriefGPT.xyz
大模型
Ask
alpha
关键词
robust generalization gap
搜索结果 - 1
稀疏性双赢:更高效的训练带来更好的鲁棒泛化
本文提出两种新颖的在对抗训练期间注入适当稀疏形式的方法,即:通过利用最近的彩票假设的结果识别早期训练中出现的关键稀疏子网络来实现静态稀疏,以及通过在训练期间使稀疏子网络自适应调整其连接模式(同时保持相同的稀疏比率)来实现动态稀疏,并发现这两
→
PDF
2 years ago
Prev
Next