Oct, 2023

不断发展的评估器 (EV3): 为知识蒸馏的灵活可靠元优化而努力

TL;DR我们介绍了一种名为 EV3 的新型元优化框架,通过直观的探索 - 评估 - 调整协议来高效训练可扩展的机器学习模型。利用 EV3,我们在每次迭代中探索各种模型参数更新,使用相关评估方法对其进行评估,并根据最佳更新和以前的进展历史来调整模型,从而提供了相当的灵活性,无需对感兴趣的关键目标施加严格的约束条件。此外,该协议欢迎具有有偏梯度的更新,并允许使用各种损失函数和优化器。我们将 EV3 应用于知识蒸馏,其实验结果显示了 EV3 在安全探索模型空间方面的能力,并暗示了由于其固有的灵活性和适应性,它在许多领域中的潜在适用性。