ACLJan, 2023

Transformer 模型中上下文混杂的量化

TL;DR本文提出了一种针对 Transformer 模型的上下文混合得分方法 Value Zeroing,用于分析模型中各个编码层次信息混合的方式,并通过多种评估方法验证了该方法的优越性。