BriefGPT.xyz
大模型
Ask
alpha
关键词
magprune
搜索结果 - 1
DELLA-Merging: 通过基于大小的抽样减少模型合并中的干扰
利用一种新的模型合并技术 DELLA-Merging,它采用了一种名为 MAGPRUNE 的修剪技术,通过首先按照参数的大小对其进行排名并给较小的参数分配更高的丢弃概率 (p),接着在随机丢弃的参数上通过缩放操作近似原始嵌入。在三种不同的专
→
PDF
17 days ago
Prev
Next