Feb, 2024

MGE: 一种无需训练的高效模型生成和增强方案

TL;DR这篇论文提出了一种无需训练且高效的模型生成和增强方案(MGE),通过考虑模型参数分布和性能,在模型生成过程中生成的模型在某些情况下不仅与正常训练得到的模型相媲美,甚至更优。与正常模型训练所需时间相比,生成模型仅需 1% 的时间。在 Few-shot 任务中,使用 Evolution-MGE 进行增强后的生成模型展现出有竞争力的泛化能力,同时生成模型之间的行为差异有潜在的对抗防御能力。