EMNLPMay, 2022

利用语言 - 图像预训练进行高效稳健的双语词汇对齐

TL;DR本文提出了一种名为 WALIP 的 UWT 方法,它基于预训练的语言 - 图像模型和 CLIP 模型,使用图像指纹来定义初始节点,再通过鲁棒的 Procrustes 算法迭代校正和细化估计的对齐,此方法在语言对和词向量不同的情况下表现出了极大的鲁棒性。