BriefGPT.xyz
Ask
alpha
关键词
discerning td learning
搜索结果 - 1
辨识时差学习
提出了一种新型的时序差异学习算法(DTD),通过引入灵活的权重分配函数,能够提高值估计并在不同情境中加速学习。
PDF
9 months ago
Prev
Next