Mar, 2024

多语句向量的自适应双语对准

TL;DR本文介绍了一种自适应双文本对齐系统 AIlign,它利用句子嵌入提取可靠的锚点来引导对齐路径,即使对于平行性不完整且不严格单调的文本也能够实现对齐。在多个数据集上的实验中,我们表明 AIlign 以准线性的复杂度实现了与现有技术水平等效的结果。此外,与 Vecalign 或 Bertalign 等最近的系统不同,AIlign 能够处理仅在局部满足平行性和单调性属性的文本。