Mar, 2024

学习推理中长度泛化的理论

TL;DR针对学习推理中的长度泛化问题,本文通过理论研究提出一种可以模拟成有向无环图(DAGs)的问题的长度泛化条件,并设计了基于该理论的问题表示方法,使用 Transformer 模型完美解决了诸如奇偶性、加法和乘法等具有挑战性的推理问题。