May, 2023

编码器 - 解码器语言模型的任务无关蒸馏

TL;DR通过探讨 MiniEnD 方法来针对语言模型(LMs)的无特定任务的精炼,以及针对编码 - 解码 LMs 的精炼,旨在让它们保持性能同时实现计算有效,从而在语言理解和摘要制作方面得到好的效果,而且 MiniEnD 与其他备选方案相比具有良好的竞争力,同时还探索了扩展 MiniEnD 到 3B 编码器 - 解码器语言模型的跨越式提升。