May, 2024

RAEE:一种无需训练的检索增强早期退出框架,实现高效推理

TL;DR通过构建检索数据库,框架 RAEE 以预测的近似分布为指导,利用类似数据的退出信息加速语言模型推理,取得了显著的效果,并在 8 个分类任务上达到了最先进的零 - shot 性能。