EMNLPNov, 2023

高效 Transformer 知识蒸馏:绩效评估

TL;DR对高效注意力转换模型进行知识蒸馏的模型压缩评估,并通过新的长上下文命名实体识别数据集 GONERD 验证了高效注意力转换模型在保持原始模型性能的同时降低推理时间的效果。