ACLMay, 2020

选择性机制如何提高自注意力网络?

TL;DR本文通过评估实现灵活通用的 Gumbel-Softmax 的选择性自注意力网络(SSANs)的性能,在多个代表性 NLP 任务中,包括自然语言推理、语义角色标注和机器翻译,实验结果显示,SSANs 一致优于标准 SANs 并通过良好设计的探针实验证明,其改进性在一定程度上归因于缓解 SANs 的两个常见缺点:词序编码和结构建模,具体而言,选择机制通过更多地关注对句子含义有贡献的内容单词,提高了 SANs 的性能。