Sep, 2024

揭示语言模型中的潜在思维链向量

TL;DR本研究解决了在语言模型中引导积极行为的难题,通过引入“引导向量”技术来推动模型进行链式思维推理,而无需自然语言提示。我们在Llama3 8b和Mistral 7b v0.2上验证了这一方法,结果显示与传统链式思维提示相比,该方法在多项推理基准测试中表现出色,且计算需求更低。