EMNLPNov, 2023

ATHENA: 数理推理中的思维扩展

TL;DR使用注意力机制的 THought Expansion Network Architecture (ATHENA) 模型通过模仿人类思维扩展机制中的神经网络传播形式,解决实际世界的数学问题挑战,并在训练示例信息受限的情况下,在各种问题中取得了新的最佳表现。