Oct, 2024

理解变压器在下一个令牌预测中的普适性

TL;DR本研究解决了变压器在自回归学习中下一个令牌预测能力机制不明的问题。我们提出了一种新的因果核优化方法,能够明确地通过之前及当前的观测预测下一个令牌,并展示了其实验结果验证了理论发现,表明该方法对一般映射的适用性。