May, 2024

上下文计数:对变压器在定量任务上的机理研究

TL;DR该研究论文介绍了一种上下文计数任务,通过理论和实证分析,揭示了 Transformer 在性能和可解释性方面的影响因素,特别是发现因果关注机制更适合该任务,并且没有位置编码可以获得最佳准确性。