Oct, 2023

基于模块的自适应蒸馏用于多模态基础模型

TL;DR通过跟踪个别模块的贡献,我们提出了一种改进的 Thompson 抽样算法 OPTIMA,用于解决模型更新导致的模块贡献的非静态性,以最大化总体贡献。