AAAIFeb, 2024

宽容专家的教师:与教师无关的无数据知识蒸馏

TL;DR无数据知识蒸馏方法 (TA-DFKD)通过为生成器分配宽松的专家角色,而非严格的监督者角色,以更健壮和稳定的性能,实现了在各种教师模型下的蒸馏,并超越了现有的无数据知识蒸馏方法。