MMMar, 2024

模型蒸馏理论探索

TL;DR蒸馏是用一个简化的模型替代复杂的机器学习模型的任务,该论文提出了蒸馏的一般理论,并应用该理论提出了新算法,可以高效地从训练好的神经网络中提取知识,将其蒸馏为简洁明确的决策树表示,并证明了蒸馏相比从头学习更廉价且复杂度有所减少。