BriefGPT.xyz
Ask
alpha
关键词
parameter allocation
搜索结果 - 3
CVPR
面向任务难度感知的生命周期学习参数分配和正则化
本文提出了参数分配与正则化 (PAR) 方法,以适应任务的学习难度,从参数分配和正则化中自适应地选择适当的策略,并使用基于最近原型距离的发散估计方法来测量任务相关性,通过时间高效的相关性感知采样搜索策略来减少分配的参数开销,实验结果表明,与
→
PDF
a year ago
重新思考预训练语言模型中的嵌入耦合
重新评估了先进的预训练语言模型中共享输入和输出嵌入权重的标准做法,表明解耦的嵌入提供了更好的建模灵活性,允许我们在多语言模型的输入嵌入的参数分配方面显着提高参数分配效率。通过在 Transformer 层中重新分配输入嵌入参数,我们在保持微
→
PDF
4 years ago
提高分区边缘学习效率的联合参数和带宽分配
本文提出了一个基于有限资源设备的边缘学习框架,其中参数以及带宽分配共同优化,实验结果表明此方法能够显著提高分区式边缘学习的性能。
PDF
4 years ago
Prev
Next