ACLJun, 2023

模块化 Transformer:将 Transformer 压缩为模块化层以进行灵活高效的推理

TL;DR本文提出了 Modular Transformers 框架,用于灵活的序列到序列模型压缩,通过模块化编码器 - 解码器并进行知识蒸馏,可以实现灵活的压缩比率从 1.1x 到 6x,并且在保持相对性能不变的情况下,可以根据需要灵活组装模块化层。