Feb, 2025

M2R2:高效Transformer推理的多速率残差混合

TL;DR本研究解决了在自回归生成中,静态残差变换导致推理效率与生成准确性之间的权衡问题。提出的多速率残差混合(M2R2)框架通过动态调节残差速度,提高了早期对齐,从而显著提升了推理效率。评估显示,在推理任务中,M2R2优于现有的基于距离的策略,达成更快生成速度与更高质量的平衡。