BriefGPT.xyz
Ask
alpha
关键词
large-scale neural networks
搜索结果 - 2
关于 [V]-Mamba 的低样本迁移能力
本文研究了大规模神经网络在少样本迁移学习中的能力,通过对 [V]-Mamba 模型与 ViTs 模型在不同少样本数据预算和高效迁移方法下的性能比较,发现 [V]-Mamba 在线性探测(LP)迁移方案下表现优于或等同于 ViTs,而在视觉提
→
PDF
4 months ago
GPipe:使用流水线并行化高效训练巨型神经网络
GPipe 是一种管道并行库,它提供了一种高效进行模型并行化的方式,可以将不同子层序列分别放在不同的加速器上,因此可以有效地将各种不同的网络扩展到巨大的规模,并且能够实现快速的线性加速,通过对两个不同任务的训练,证明了 GPipe 的优势。
PDF
6 years ago
Prev
Next