ACLJun, 2023

寻找甜点:低资源环境下自适应推理的分析与改进

TL;DR本论文比较了有限训练数据情况下,自适应推断的两种主要方法:Early-Exit 和 Multi-Model,提出了一种名为 SWEET 的 Early-Exit 微调方法,在保持速度相当的情况下,优于 Early-Exit 和 Multi-Model,最终表明 SWEET 同时具备两种方法的优点,并为 NLP 中进一步降低推断成本打下了基础。