BriefGPT.xyz
大模型
Ask
alpha
关键词
hiddenkey
搜索结果 - 1
LoRA 遇见 Dropout: 一个统一框架下的研究
基于对参数高效 LoRA 的研究,我们重新审视了特定于 Transformer 的 Dropout 方法的数学和经验上的等价性和区别,并基于此提出了一个统一的框架,揭示了当涉及到有限可训练参数时它们的新偏好和性能比较。这个框架还允许我们将最
→
PDF
4 months ago
Prev
Next