Feb, 2024

重复改进语言模型嵌入

TL;DR提供了一种解决自回归模型的架构限制的简单方法,即 “回声嵌入”,通过在上下文中重复输入并从第二次出现中提取嵌入,使得提前的标记嵌入能够包含后面的标记的信息,从而最大程度地利用高质量 LLMs 进行嵌入。在 MTEB 榜单上,回声嵌入在零 - shot 情况下改进了超过 9%,细调时改进了约 0.7%。用 Mistral-7B 模型的回声嵌入相较于之前没有利用合成调优数据的开源模型达到了最新技术水平。