Apr, 2022

跨语言短语检索

TL;DR本文提出了一种从无标注例句中提取短语表示以实现跨语言短语检索的方法 XPR,并创建了一个包含 65K 双语短语对和 4.2M 例句的大规模跨语言短语检索数据集。实验结果表明,XPR 表现优于利用词级或句级表示的基线。XPR 还显示了令人印象深刻的零 - shot 迁移性,使模型能够在训练期间执行未见过的语言对的检索。