ICLRMar, 2024

神经算法推理的马尔可夫性质:分析与方法

TL;DR神经算法推理是一种新兴的研究方向,它赋予神经网络以逐步模拟算法执行的能力。本文的观察是,现有设计中的历史依赖性与算法推理任务的马尔可夫性质相矛盾。基于这一动机,我们提出了 ForgetNet,它不使用历史嵌入,因此与任务的马尔可夫性质一致。为了解决 ForgetNet 在早期训练阶段的挑战,我们进一步引入了 G-ForgetNet,使用门控机制来实现历史嵌入的选择性集成。这种增强的能力在模型的早期训练阶段提供了有价值的计算路径。基于 CLRS-30 算法推理基准,我们进行了大量实验证明,ForgetNet 和 G-ForgetNet 相较于现有方法更具有泛化能力。此外,我们研究了门控机制的行为,突显了其与我们的直觉的一致性以及在稳健性能方面的有效性。