Mar, 2024

在线神经演员 - 评论家算法的弱收敛分析

TL;DR使用在线演员 - 评论家算法训练的单层神经网络在隐藏单元数量和训练步骤数量趋于无穷大时,收敛于随机常微分方程 (ODE)。