Apr, 2024

LLM2Vec: 大型语言模型是强大的文本编码器

TL;DR我们引入了 LLM2Vec,这是一种简单的无监督方法,可以将任何解码器模型转换为强大的文本编码器,通过三个简单步骤:启用双向注意机制,掩码下一个标记预测和无监督对比学习,在英语词和序列级任务中,LLM2Vec 在词级任务上远远超过编码器模型,在 Massive Text Embeddings Benchmark (MTEB) 中获得了新的无监督最新性能,通过与有监督的对比学习相结合,我们在 MTEB 上实现了使用公开数据训练的模型的最新性能。