Jan, 2024

封闭源语言模型的知识蒸馏

TL;DR在这篇论文中,我们提出了一种基于贝叶斯估计框架的方法,通过估计闭源语言模型的输出分布来执行传统的知识蒸馏,实验结果表明我们的方法超过了直接在闭源语言模型生成数据上微调的当前模型的性能。