Apr, 2022

TangoBERT:使用级联架构以降低推理成本

TL;DRTangoBERT 是一种分层式的模型架构,能够通过在推理时间内降低计算负载来实现高速推断,并利用常规层级变压器模型的批量大小优化来增加相对推断成本的降低。