ACLFeb, 2023
序列标注的编码器 - 解码器 Transformer 蒸馏
Distillation of encoder-decoder transformers for sequence labelling
Marco Farina, Duccio Pappadopulo, Anant Gupta, Leslie Huang, Ozan İrsoy...
TL;DR本文提出了一个无幻觉的框架,以序列标记为例,该框架非常适用于蒸馏,追求计算效率的蒸馏方法有望从这些大模型获得的知识中获益,并在多个序列标记数据集上展现了新的卓越表现,证明了这个框架在少量数据学习场景下进行大模型蒸馏的有用性。