Jun, 2024

滞后的跳跃:探索大型语言模型在多次跳跃查询上的限制

TL;DR大型语言模型在解决复杂的多步问题方面能力强大,本研究通过分析Transformer-based LLMs内部计算过程,发现其在处理多跳查询和信息抽取时采用了潜在的计算步骤,进而提出了一种新颖的“回补”分析方法,帮助解决模型在后期计算中可能缺乏必要的功能,从而为理解和改进Transformer-based LLMs中的潜在推理提供更多机会。