May, 2023

剖析思路链:MLPs在语境中的组合学习研究

TL;DR通过研究CoT在transformer的上下文学习中的影响,揭示CoT的成功归结于将组合函数的上下文学习分解为两个不同的阶段,并证明了CoT显著降低了上下文学习的样本复杂度并便于学习比非CoT方法更复杂的函数。