Sep, 2022

将跳过连接模型重新构思为可学习的马尔可夫链

TL;DR本文提出了可学习的马尔科夫链理论来解释残差神经网络中跳跃连接的行为,并通过引入罚式连接来使模型更加高效。实验结果表明,该方法在多模式翻译和图像识别任务中有着优异的表现。