Mar, 2024

GOLD: 通过基于超出分布引导的语言数据生成进行的泛化知识蒸馏

TL;DR基于语言模型的知识蒸馏是提高语言模型的有效部署的关键。本文提出了 GOLD,一种任务无关的数据生成和知识蒸馏框架,通过迭代的超出分布引导的反馈机制来改善生成数据的泛化能力。我们在 10 个不同的分类和序列到序列任务的自然语言处理方面的广泛实验中验证了 GOLD 的优越性和对 less explored 和 novel 任务的适用性。