BriefGPT.xyz
大模型
Ask
alpha
关键词
dropout methods
搜索结果 - 3
LoRA 遇见 Dropout: 一个统一框架下的研究
基于对参数高效 LoRA 的研究,我们重新审视了特定于 Transformer 的 Dropout 方法的数学和经验上的等价性和区别,并基于此提出了一个统一的框架,揭示了当涉及到有限可训练参数时它们的新偏好和性能比较。这个框架还允许我们将最
→
PDF
4 months ago
ACL
多编码器有帮助吗?基于上下文的神经机器翻译案例研究
研究多编码器方法在文档级神经机器翻译中的应用,证实上下文编码器不仅编码周围的句子还会产生噪声,探讨引入噪音和严谨的 dropout 方法在多编码器 NMT 中的作用,实验结果证明噪声训练在小数据集中发挥重要作用,并通过使用噪音生成和 dro
→
PDF
4 years ago
深度神经网络的 Dropout 方法调查
本文总结了 dropout 方法的历史、各种应用以及当前研究兴趣的领域,同时详细描述了一些重要的提出方法。
PDF
5 years ago
Prev
Next