May, 2024

EMR-Merging:调优无需参数的高性能模型合并

TL;DR我们在这篇论文中讨论了使用单个模型权重来合并多个模型以获得多任务能力的方法,并提出了Elect, Mask & Rescale-Merging (EMR-Merging)的方式,通过生成轻量级的任务特定调节器来对齐统一模型和每个特定模型之间的方向和幅度,无需调整或训练即可展现出令人瞩目的性能。