Jul, 2023

切线模型组合用于集成和持续微调

TL;DRTangent Model Composition (TMC) 是一种将组件模型独立微调到预训练点周围并组合的方法,旨在支持增量学习、组合或取消学习,并在推理时通过标量组合组合组件模型,从而将集成成本降低到单个模型的成本以提高准确度,在 13 个实验和 3 个基准数据集上相对于非线性微调模型的组合在推理成本减少 2.5 倍到 10 倍的同时提高了 4.2% 的准确度,适用于增量微调、并行处理,无须重播缓冲区。