BriefGPT.xyz
Ask
alpha
关键词
fisher-weighted averaging
搜索结果 - 1
COLING
语言模型融合的费舍尔掩码节点
我们引入一种新的模型合并方法,将先前在 Fisher 加权平均和模型修剪中对 Fisher 信息的使用的工作见解与 Transformer 结构内的掩码节点的 Fisher 信息相结合,提出了一种计算高效的加权平均方案。我们的方法在 BER
→
PDF
4 months ago
Prev
Next