Sep, 2021

DACT-BERT: 适应性可微分计算时间的高效 BERT 推理

TL;DR本文提出了 DACT-BERT,一种用于增加自然语言处理的计算效率的自适应计算时间策略,该策略通过控制 Transformer block 的数量来改善 BERT 模型的计算效率。实验结果表明,相较于基线模型,DACT-BERT 在减少计算资源的情况下表现出色,并在其他计算资源受限的情况下也具有竞争力。