Jun, 2024

Transformer 中的位置编码初始化对关系推理的重要性

TL;DR学习可学习的位置编码对关系推理任务的重要性进行研究,发现可学习的位置编码优于常用的其他位置编码,并且初始化对学到的表示和下游泛化性能有着重要影响。结果表明,在没有提供或无法确定真实位置的任务中,学习高性能和鲁棒性的位置编码对关系推理任务非常重要。