BriefGPT.xyz
Mar, 2022
静态和上下文多语言嵌入的结合
Combining Static and Contextualised Multilingual Embeddings
HTML
PDF
Katharina Hämmerl, Jindřich Libovický, Alexander Fraser
TL;DR
本文介绍了一种将静态嵌入和上下文嵌入相结合的方法,通过提取40种语言的静态嵌入并使用VecMap校准来改善多语言表示,与此同时,应用新颖的持续预训练方法来进一步提高XLM-R的表示精度,并在多个复杂语义任务中展现出积极的效果。
Abstract
Static and contextual
multilingual embeddings
have complementary strengths.
static embeddings
, while less expressive than
contextual language mod
→