EMNLPSep, 2021
通过辅助序列预测任务诱导 Transformer 的组合泛化能力
Inducing Transformer's Compositional Generalization Ability via Auxiliary Sequence Prediction Tasks
Yichen Jiang, Mohit Bansal
TL;DR该论文提出了两种辅助序列预测任务来帮助解决神经模型在学习符号结构时的不足,并通过在 SCAN 数据集上的实验证明了所提出的方法可以提高 Transformer 模型理解命令的组合结构的能力。