Jun, 2024

3D-RPE: 通过 3D 旋转位置编码增强长上下文建模

TL;DR使用 3D 旋转位置编码(3D-RPE)在三维球上对象进行编码,具有可控的长期衰减和提高的位置分辨率,可应用于模拟长上下文和长序列任务中,特别在长上下文自然语言理解任务中表现出性能的提升。