AAAIDec, 2021

Block-Skim: Transformer 的高效问答

TL;DR通过 Block-Skim 的方法,即从 Transformer 模型的内部权重中识别出需要进一步处理和可以尽早舍弃的上下文信息,从而明显提高了 QA 模型的准确性并实现了 3 倍加速。