Apr, 2024

理解基于注意力的编码 - 解码网络:以国际象棋记分表识别为例的案例研究

TL;DR深度神经网络在学习复杂预测任务方面广泛使用,本文通过研究带有注意机制的编码器 - 解码器循环神经网络,旨在更好地理解这种网络的学习过程。通过对手写棋谱的任务进行表征,并实验性地研究影响学习的因素,我们发现了输入 - 输出对齐、序列模式识别和手写识别之间的竞争、合作和依赖关系。我们认为这些知识有助于更好地平衡因素,以正确训练网络。