Feb, 2024

借助合成图导航模型增进对 Transformer 中逐步推理的理解

TL;DR通过研究一种合成任务中的自回归 Transformer 模型,我们揭示了逐步推理的机制,并发现了在该任务中观察到的几个现象:(i)逐步推理推理间隔;(ii)模型生成中多样性与准确性之间的权衡;(iii)模型输出的简洁偏见;以及(iv)上下文示例中的组合概括和原位偏见。这项工作引入了一个基于合成框架的研究逐步推理,并提供了可奠定对该现象更深入理解基础的机制性假设。