EMNLPOct, 2020

EOS 决策和长度外推

TL;DR研究神经生成模型中扩展到未知序列长度的挑战,表征了一种常常被忽视的建模决策:通过使用特殊的序列结尾(EOS)词汇项来预测生成过程的结束,探讨了在测试时强制模型生成到正确序列长度的神谕设置,对比训练预测 EOS (+EOS) 神经网络与未训练 (-EOS) 神经网络的长度外推行为,发现 -EOS 显著优于 +EOS,能够在括号闭合任务中良好地外推到比训练时间长 10 倍的长度,以及在困难的 SCAN 数据集长度泛化任务中比 +EOS 实现了 40% 的提升。