BriefGPT.xyz
Ask
alpha
关键词
backpropagation through time algorithm
搜索结果 - 1
实时循环强化学习
我们提出了一种新颖的强化学习算法,名为实时循环强化学习 (RTRRL),通过利用随机反馈局部在线学习 (RFLO) 近似实时递归学习 (RTRL) 来计算循环神经网络参数的梯度,并结合具有资格迹的时序差分强化学习 (TD (λ)),能在部分
→
PDF
8 months ago
Prev
Next