ACLMay, 2023

解释 Transformer 如何利用上下文来建立预测

TL;DR本文使用 Transformer 的最新可解释性进展提出了分析语言生成模型的过程,并使用对比实例比较了我们的方法与渐变和扰动基线的解释的一致性,结果表明我们的方法具有更好的表现。最后,我们将该方法应用于神经机器翻译模型,并展示了生成人类相似的源 - 目标对齐结果的能力。