ACLMay, 2021

TR-BERT:动态令牌减少以加速 BERT 推理

TL;DR本文提出一种动态适应层级的 Token 缩减方法 TR-BERT,该方法采用强化学习方法学习 Token 减少的选择策略以加速 BERT 模型在各种自然语言处理任务中的推理,并在实验中展示了 TR-BERT 在加速 BERT 模型的同时提高了其性能。