BriefGPT.xyz
Ask
alpha
关键词
neural temporal difference learning
搜索结果 - 1
关于神经网络在时间差异学习中的性能
神经时间差异学习是一种用于策略评估的近似时间差异方法,它利用神经网络进行函数逼近。本论文通过对投影到初始点 θ₀周围半径为 ω 的球 B (θ₀, ω) 的神经时间差异学习的收敛性分析,展示了一个近似界限为 O (ε)+~O (1/√m),
→
PDF
7 months ago
Prev
Next