Mar, 2024

危机相关社交媒体文本的语义丰富跨语言句子嵌入

TL;DR通过使用多语言句子编码器,我们提出了一种能够为 50 多种语言中的相关社交媒体文本进行嵌入的模型,以使具有相似含义的文本在相同的向量空间中靠近,无论语言多样性如何。研究结果对句子编码和匹配任务表现出良好的性能,表明这些模型可以作为嵌入多语言危机相关社交媒体文本时的强大基准模型。