Oct, 2024

泰迪:通过泰勒近似匹配的高效大规模数据集蒸馏

TL;DR本研究针对大规模数据集蒸馏的高内存和时间复杂度问题,提出了一种名为“Teddy”的新框架,利用泰勒近似来提升效率。关键发现是,通过使用预缓存的弱模型池,而非每次迭代训练新模型,能够显著提高运行效率和性能,特别是在处理大规模数据集时,实验表明效率和性能均达到了当前最先进的水平。