BriefGPT.xyz
Ask
alpha
关键词
sparse iso-flop transformations
搜索结果 - 1
稀疏 Iso-FLOP 变换以最大化训练效率
通过引入一种基于单一超参数的稀疏 Iso-FLOP 变换族,本文试图使用稀疏性提高密集模型的准确性和 FLOP 效率,实现不更改任何训练超参数而在计算机视觉和自然语言处理任务中获得显著的提高,例如 ResNet-18 在 ImageNet
→
PDF
a year ago
Prev
Next