Feb, 2024

词嵌入再探讨:LLMs是否提供新的东西?

TL;DR通过比较经典词嵌入技术与大型语言模型的词嵌入之间的潜在向量语义,系统地调查了大型语言模型是否在表现上与经典编码模型存在显著差异。结果显示,大型语言模型往往比经典模型更紧密地聚集语义相关的词,并在Bigger Analogy Test Set (BATS)上取得更高的平均准确率。此外,一些大型语言模型的词嵌入与相对较轻的句子级BERT (SBERT)模型相似。