Oct, 2024

解构递归、注意力和门控:探讨变换器和门控递归神经网络在动态系统预测中的可迁移性

TL;DR该研究解决了机器学习架构在动态系统预测中可迁移性缺乏明确验证的问题。通过分解和重组RNN和变换器的关键组件,研究发现神经门控和注意力机制可以普遍提升RNN的性能,而在变换器中引入递归概念则会适得其反。研究结果表明,结合递归高速公路网络的创新架构在高维时空预测中表现最佳。