Apr, 2025

动态计算:基于变换器和Mamba架构的DYNAMAX

TL;DR本研究解决了在解码器架构和Mamba模型中早期退出机制应用不足的问题,通过引入DYNAMAX框架,首次利用Mamba架构的独特性质整合早期退出机制。实验结果表明,Mamba能够作为高效的早期退出分类器,提高计算效率,推动嵌入式应用和资源受限环境中的动态计算。