BriefGPT.xyz
大模型
Ask
alpha
关键词
long-context reasoning
搜索结果 - 2
LLM 长文本语境失误的洞见:当转换器知道但不透露
大型语言模型(LLM)存在位置偏差,难以利用长篇上下文中间或结尾的信息。我们的研究通过探测其隐藏表示来探究 LLMs 的长篇上下文推理能力。我们发现,虽然 LLMs 编码目标信息的位置,但在生成准确回答时往往未能充分利用这一特性。这揭示了信
→
PDF
14 days ago
SIGIR
量化对增强检索生成的影响:小型 LLMs 分析
通过评估不同量化方法对不同规模的大型语言模型在长上下文环境下执行反馈增强生成任务的影响,研究发现对于表现良好的较小规模语言模型而言,量化并不会削弱其长上下文推理能力,从而证明了利用量化的较小型语言模型进行反馈增强生成是可行的。
PDF
24 days ago
Prev
Next