May, 2023

通过随机填充实现位置嵌入的令人沮丧的简单改进

TL;DR本文提出了一种简单而有效的策略 Random Padding 来平衡位置嵌入的更新次数,从而在提取式问答的模型性能上获得显著提升。在训练模型对长文本进行评估时,特别是当模型在短文本上进行训练时,Random Padding 会表现得更加优异。