ACLMay, 2021
TR-BERT:动态令牌减少以加速 BERT 推理
TR-BERT: Dynamic Token Reduction for Accelerating BERT Inference
Deming Ye, Yankai Lin, Yufei Huang, Maosong Sun
TL;DR本文提出一种动态适应层级的 Token 缩减方法 TR-BERT,该方法采用强化学习方法学习 Token 减少的选择策略以加速 BERT 模型在各种自然语言处理任务中的推理,并在实验中展示了 TR-BERT 在加速 BERT 模型的同时提高了其性能。