BriefGPT.xyz
大模型
Ask
alpha
关键词
gpu memory and time efficiency
搜索结果 - 1
稀疏调整:用高效的微调和推理调整视觉 Transformer
Sparse-Tuning 是一种新的调优范式,通过稀疏保存信息标记并合并冗余标记,提高对前景的关注并降低背景区域的计算成本,实现了对预训练的 ViT 模型进行高效的微调和推断,同时具备了现有方法无法满足的 GPU 内存和时间效率要求。
PDF
a month ago
Prev
Next