Apr, 2023

序列到序列模型的结构剪枝:提高推理效率的非对称方法

TL;DR该研究研究了模型大小、结构修剪、推理效率和摘要准确性之间的关系,发现准确性与编码器大小相关,而推理效率与解码器相关,使用非对称修剪可以在保持相同摘要准确性的情况下将推理延迟减少近 3 倍。